Googleにもできなかったメタデータ作成の現場を見た
テレビ・メタデータの重要性についてはこれまで何回か書いて来た。(12月31日ポスト、1月20日ポストなど)このメタデータ、何となく最新の技術のように思えるが、実はほとんど人力で作られているそうだ。あのGoogleもテレビ・メタデータ作成をプログラムを組んでコンピュータにやらせようとしたが、できなかったそうだ。しかも海外ではこのようなメタデータを作っている企業や組織はなく、日本独自のものなのだという。
ではそもそもメタデータは実際にはどうやって作られているのか。テレビ・メタデータの調査・分析・配信をしている株式会社エム・データさんに頼んでデータ入力センターを見学させてもらった。
赤坂を出てJRの特急を使って2時間程、水戸市の中心部にあるセンターは建坪120坪の2階建て、1階はマネジメントスペースで2階がオペレーティングスペースだ。薄井取締役をはじめ水戸のスタッフの方が説明してくれた。
データ入力センター
(正面右に停めてあるのが社長のキャンピングカー)
表には、関根社長のキャンピングカーがドーンと停めてある。これで地震がきても生き延びられるそうだ。東北大震災の時はPCもモニターも何もかもがひっくり返り、復旧するのに3日かかりデータ入力の遅れをとり戻すのに1週間かかったそうだが、この時もキャンピングカーから電源を供給するなど活躍したそうだ。
ここで24時間365日、総勢100名のオペレーターが、テレビで放送されたありとあらゆるデータを入力している。一日のピークは早朝から昼前と夕方の2回で、この時は40名のオペレーターがフル稼働するそうだ。
オペレーションルーム
(見学した時は割と暇な午後の時間帯だった)
こうして入力したデータは、放送後、数分から数十分で配信する。例えばクライアントである某キー局の情報番組には、同時間帯の全局のデータが放送後、数分で届く。反省会で他局分析に使うのだという。
テレビ・メタデータとは、テレビで放送された番組やCMに関する情報を、タイムスタンプ(何日の何時何分何秒のデータか)と紐付けさせたテキストデータだ。これをジャンル別に説明しよう。
*番組情報
番組のトピックス、人物名、企業名、テーマなどあらゆる情報を入力。入力作業では間違え易い言葉や名前などを収容してある辞書データベースが大きな役割を果たす。ミスを減らし、入力作業が楽になる。現在、音声・画像認識もテスト中だそうだ。
*CM情報
どんなCMがいつ、どれくらい(何回)流れたかを記録している。音声認識の技術で、既出のCMは自動的に認識し記録できる。CMに出演しているタレント名、楽曲名の他キーワード、ナレーション内容なども記録しており、全て検索できる。例えば、「白い車が雨の中を走るCMは何?」という検索もできるそうだ。
*商品情報
一次情報である番組情報の中から商品、店舗、宿の情報を取り出して整理している。Eコマースサイトからの需要が多く速報性が要求される。「今、○○という番組で放送された△△」という商品はドル箱商品らしい。最速で5分で出力する。ただし、ネガティブ情報(例えば、食中毒を出した宿など)ははじく。これがなかなか難しいらしい。一次情報では、商品・店舗・宿情報にはこうしたネガティブ情報も入ってしまい、これを受け取ったクライアントは、自分でチェックしてサイトに載せなければならないが、エム・データ社の情報は、そのまま載せる事ができるとのことだ。
商品の販売元情報、価格情報、商品コードの他、どのECサイトのどの店舗で売っているか、さらに宿やリアル店舗がどこにあるのかGPS情報までまで人力で調べ入力する。一度入力した店はデータベースに登録し、2回目からは作業が省力化される
*ランキング情報
例えば昔、ブロードキャスターという番組のワイドショー講座でやっていた、どのネタをどれくらいの時間放送したかなどのランキング情報は、番組情報を元に集計する。総合、時事、スポーツ、芸能の4ジャンルで、例えばタレント別の出演時間ランキングは1日でも1週間でも1ヶ月でも1年でも自動的に集計できるようになっている。
(次のページへ続く・・・)
コメント
ワンセグ全番組タイムシフト視聴は視聴率を下げるのか検証してみた〜ガラポンTV視聴ログより
リアルタイムの放送をテレビで視聴する人が増えることは良いことです。 言うまでもなくこれは「視聴率が上がる」ことを意味します。 &nb…
この記事へのコメントはありません。