サーバの制約により,ディスクスペースを節約する必要があったため,KUSK Databaseでは可視光カメラとKinect カメラにおいて,動きのないフレームは保存していません.
このため,撮影時の実際のフレーム番号とビデオファイルのフレームの番号が一致していません.
CSVファイルでタイムスタンプの前に記述されている数字は,実際のフレーム番号を表しています.
従って,例えばn行目の番号がmであれば,ビデオファイルのnフレーム目が実際にはmフレーム目であることを示しています.
なお,動きの有無の判定に関するアルゴリズムの詳細は下記の文献に記述しています.
A. Hashimoto et al, “KUSK Dataset: Toward a Direct Understanding of Recipe Text and Human Cooking Activity,” CEA2014