14 posts tagged “technology”
6月28日に行ってきた「SiliconLIVE!フォーラム2006」のレポートが日本SGIのサイトに上がっていた。
・レポート(4) 放送と通信の連携はどこまで進んだのか。そして、どこへ進もうとしているのか
まとめの辺りをちょっと補っておくと、コーディネーターの吉井氏が1929年の挿し絵を出して「この絵にはリモコンが無い」とコメントしたはず。これはとても大事な点。リモコンこそが放送の主導権を消費者に移行させるきっかけとなったツールなのだから。一方的に押し付けられる“放送”では無くて、視聴者がコンテンツに積極的に関われる“通信技術”の先祖という事。
・Microsoft Live Labs: Photosynth
が、ここ数日、
・Microsoft Live LabsのPhotosynth によるリアルタイムパノラマ
他で話題になってるけど、これ面白い。
しばらく前に、「携帯カメラでブレットタイム(タイムスライス)ができないか」と考えた事があった。今思えばPhotosynthのコンセプトにそこそこ近かったな、とにやり。
Photosynthではいまのところ写真の位置情報しか利用しないようだけど、時間情報や補正用のカメラ情報(絞り、シャッタースピード等)もメタ情報として追加すれば、季節別のシーンや、昼夜別のシーン、細かいところでは被写界深度もかなり正確に再現できるんじゃないかと思う。もちろん今日明日の話ではないだろうが。
重要なのは、それらの写真が誰かのローカルハードディスクとかサーバに一括して入っているんじゃなくて、ネットワークで繋がった撮影者それぞれのスペースからリアルタイムにパノラマを合成処理して欲しいという事。
つまり、メタデータだけを流通させて、必要な時だけオリジナルのRawデータを参照するのが将来のアーキテクチャとして美しいと思う。別に世界的なストレージの仮想化までは必要ないはずだし。
そしてこれは解像度の違いはあるにせよビデオにも応用できる技術なので、近い将来、保護者同士が子供の運動会のビデオを共有して、どんなシーンのどんなアングルでも再現できる日が来るんじゃないかな。と楽観的に言っておこう。
毎年行ってる産業用VR展だけど、なんか今年は「VIP特別入場者証」とかいうのを送ってきたので、恥ずかしがりつつ見てきた。いろいろ面白いのがあったので、時間が取れれば後で書く。癌研の前の紫陽花の植え込みがきれいだった。
↑全然人気が無いんじゃなくて、写真を撮ったのが閉館間近だったから。結構混んでいた。
AV Watchの記事「TJC、H.264エンコーダ無償ダウンロードを開始」を読んで早速その実力を試してみる。MainConceptからフリーでダウンロードできる次世代コーデック「H.264」は、まだプレビューバージョンなので、最適化の余地が残っているようだ。
とりあえずSONY製DV codecの6分程度のAVIファイルをH.264のMain Profileでエンコードしてみる。設定はよく分からないので(笑)すべてデフォルトのままで、ビットレートは3Mbps。ポチッとボタンを押してエンコードを始めると、しばらくなにやらゴソゴソと計算をしてから、作業終了までの予想時間が表示された。
え、6時間もかかるんですか?
おかしいなあ、AV Watchの記事だと、Pentium M 1.5GHzでほぼ実時間でエンコード出来ているようなんだが。こっちのPCはPentium 4 2.8GHzだし、メモリはたっぷり積んでいるし、何でこんなに遅いんだろう。実時間の50倍以上もかかるのはやっぱり変だよなあ?
AV Watchのテストとの違いと言えば、ソースファイルがMPEG 2か、DV codecか、くらいなんだが、それが問題なのかなあ?空間圧縮だけでなく、いちど時間圧縮をかけたソースだと早く演算できるのだろうか?
うーむ、何か違うような気がする。明日もう少し調べてみるか。
(2004.2.26 追記)
朝から今度はMPEG2へのエンコードテスト。CBR 6Mbpsの設定で8分くらいで終了。まあ、こんなものだ。で、もう一度H.264へエンコードしてみると、やはり6時間くらいかかる表示が出た。
自分の検証環境が特殊だとは思えないので、ダメ元とは思ったがMainConceptのサポート担当にメールを出し、同時にAV Watch編集部にも相違についてメールで聞いてみた。プレビューバージョンの製品だからメーカーが対応しないのは当たり前だが、15分もしないうちにAV Watch編集部からメールが入った。それによると、
「約14分のMPEG-2ファイル」は、「約14秒のMPEG-2ファイル」の誤記
だそうだ。ははは、やっぱりそうか。実は昨日、編集のIさんと「分」と「秒」を間違えたんじゃないの?と言っていたのだ。記事を見ると、先ほどメールを出す前にはなかった訂正が赤文字でしっかり入っていた。
な訳で、H.264のエンコードには多大なCPUパワーが必要と言う事でした。
(2004.2.27 追記)
MainConcept社の担当さんからも丁寧なメールをいただいた。ベータバージョンの製品に対してもキチンと対応してもらえるとは嬉しいですね。
PAGE 2004の3Dコンソーシアム会場で名刺交換したオー・エイ・エス(株)の企画開発部の方から電話があり、会場で見せてもらった「MarioGear」を会社でデモしていただける事になった。この件には社長も強い興味を持っていたので、ありがたい申し出だ。
「MarioGear(マリオギア)」は30cmくらいの組み立て型人形を使ったモーション・キャプチャシステムで、生身の人間にセンサーをつけてキャプチャするシステムに比べて色々なメリットがある。
- 省スペース。机の上でもキャプチャが出来る。体育館や大型倉庫や天井の高いスタジオは要らない。
- 省PCパワー。ごく普通のWindows PCでキャプチャできる。展示会場ではNote PCで動いていた。SGIのOnyxは必要ない。
- 省ヒューマンリソース。人形の動きをコマ送りしていくキャプチャ方法なら、クレイメーションと同じで、一人でも出来る。
- リアルタイム性。関節をフリーな状態にして、人形劇の操り人形のように扱えば、リアルタイムキャプチャも可能。
- ビデオ映像をテンプレートに出来る。実際の人間の動きをビデオ撮影し、3D空間内に配置できるので、それに合わせた動きをトレースするのが容易。
- 64ch同時キャプチャ。人間型のモデルではデフォルトで42ch使用するが、まだ余裕があるので、尻尾をつけたり、脚を増やしたりが可能。
- 後加工を手馴れた環境で行うため、あたりまえに「BVH出力」が出来る。
PAGEの会場でもNHKプレマップのナビゲーター、ひょっこりひょうたん島の「ドン・ガバチョ」を収録している現場の写真を見せてもらっていた。人形使い二人が分担してリアルタイムに手足を動かし、取り込まれたデータにサーフェスが貼られて、レンダリングされて、キー信号と共に合成用スイッチャーに送り出されていく。フェイシャルアニメーションは別のシステムが担当していて、PS2のコントローラで顔の表情を切り替えている。こんな事がSGI製品を使わなくても可能になるとはなあ(昔を懐かしむ遠い目)。
人形すら使わないビデオベースの「PV STUDIO 3D」などというのも出てきたし、モーション・キャプチャも個人の手の届くところに入りつつあるようだ。
だいぶ「マイノリティレポート」に現実が追いついてきた。後は3Dカメラだな。
NTTが昨日発表した「インフォ・マイカ」にビックリ。切手サイズのプラスチック樹脂に1GBのデータが記録できると言う。2005年中の製品化を目指しているそうだ。読み出し用ドライブが数千円、メディアは100~200円とかなり安価らしいが、問題は書き込みにどれだけ費用がかかるかだな。書き込みのプロセスがあまりに高価だと、DVD-VideoやAudio CDの代わりにはなるかもしれないが、コンテンツ制作者にとってのメリットはあまり無いかもしれない。しかし将来的には同じ切手サイズで10GBが可能になるらしい。湯水のようにストレージを消費するデジタルビデオ屋にとってはあまりに魅力的だ。
CD/DVDのマスタリング技術が流用可能との事なので、書き込みの機構の移植が簡単であるなら、パナソニックのDVCPRO P2のバリエーションとしてすぐにでも採用してもらいたいが、たぶん技術的なハードルはそんなには低くないのだろうな。
参考記事:
ASCII24 NTT、プラスチック製光メモリー“インフォ・マイカ”を開発――プロトタイプでは切手サイズに1GBのデータを記録
AV Watch NTT、切手大の1GBプラスチック媒体「Info-MICA」を開発
ITmedia 1枚数百円の1Gバイトメモリが実用化へ NTT、新プラスチックメモリの試作に成功
NET&COM 2004のNTTデータブースで、実用的なcell computingのソリューションを見つけた。今までも「セル」とか「グリッド」とかいう技術を使った、宇宙人を探したり、癌や白血病の解析をしたり、パルサーやブラックホールを分析したりするプロジェクトには積極的に参加してきたし、去年行っていたNTTデータの実験にも参加した。今回展示されていたのはもっとビジネスに直結するもので、特に「イントラネット型cell computing」パッケージを使用したフリーのレンダラーPOV-Rayでの3D CGのレンダリングは、現在ポピュラーになってきている企業内ネットワークレンダリングを大規模にしたイメージに近い。
NTTデータはcell computing用のサーバとクライアントのライセンスをセットにして販売するらしい。現状ではアプリケーションがPOV-Rayしかないようだが、商用の3D CGやDigital Videoアプリケーションに対応すれば結構導入されるんじゃないだろうか。とりあえずMayaと3ds maxとSOFTIMAGEで使えるようにして、最終的にはRenderManで利用できれば国内外の大手CGプロダクションはこぞって買うと思う。
また、コンシューマにゲームや映画のコンテンツ制作の一員として参加してもらう方法も検討中のようだ。これも制作体験を消費に結びつける観点からは面白い試みかもしれない。
生放送を見て、今も再放送を見ているNFLスーパーボウル。今回の放送はテレビ放送の技術革新という面では目新しいものは無かったが、デビューして4年目になるのかな、CBSの360°全周囲カメラシステム「EYE VISION」が地味ではあるが着実な進歩をしていた。
中継放送はHD(16:9)で行われていたのだが、EYE VISIONの時だけSD(4:3)に画面が切り替わってしまうのはまあ仕方がない。30台以上のカメラを連携させるシステムだけに、まだHDには移行できないのだろう。ただし、SDとはいえデビュー当時のような荒い画像ではなく、十分鑑賞に堪えうるクオリティに成長していたのは喜ばしい。
ゲームの中でEYE VISIONが有効なシーンが少なかったせいか登場回数が非常に少なかったが、これからのこのシステムの有効活用方法として、EYE VISIONを構成する全てのカメラの映像をインターネットで流してはどうだろうか?300Kbpsくらいのストリームを30本流しても9Mbpsだから、近頃の家庭に入っている高速なADLSや光ファイバなら帯域的には問題ない。サーバの負担は膨大だけど。そしてPC側でスイッチングのアプリケーションを用意して、視聴者に自由に映像をスイッチングさせるのだ。様々な権利が絡んでいるから実現は難しいと思うけど、もし可能になれば、それこそが臨場感っていうものだよね。ヴァーチャルリアリティへの現実的な第一歩としてCBSにちょっとだけ期待しておく。
外出中にIMAGICAデジックスの営業さんが来たようで、机の上に挨拶と各種パンフレットが置いてあった。いつもどおりNitrisを始めとするAvid製品群やvi[z] シリーズ、Teranexのフォーマットコンバータ、cinecureという手動パラ・キズ消しシステム、おなじみのセルアニメ支援ツールAnimoなどなど。
目新しいところでは、「mokey」かな。IMAGICAデジックスによれば、
「mokeyは任意の動画映像からクロマキーを使わずに前景画像を抽出し、マスクも生成するソフトウェアです。」
なんか面白そうだ。つまりはブルーバックやグリーンバックの映像でなくとも「抜ける」と言う事なのだな。開発したImagineer Systems Limitedにデモ版があるので早速登録してダウンロードページに行ってみたら、マニュアル、ソフトウェア、チュートリアルムービーの合計サイズが200Mbytesを超えている。と言うわけで、ダウンロードの合間にこの記事をエントリーしているのでありました。デモ版の使用感などは明日以降ですな。
