世界を変えるテクノロジー、人達を追う(本サイトでは、「アフィリエイト広告」を使用しています)

テクノロジーの羅針盤

AI ChatGPT Sora

動画生成AI「Sora(空)」をOpenAIが発表 一般公開はいつ? 個人で映画作成も?

投稿日:


2024年2月15日に、OpenAIが動画の自動生成機能を公開した。(2024/5月現在では、一般の人は使えない。一部のクリエーター、研究者からのフィードバックをもらうために公開中)

誰もが、自分の作りたい映画を作れる時代がすぐそこに来た?

テキストのプロンプト(命令)から、ぱっと見ではAIが作ったとは思えないリアル感たっぷりの動画や、VFXの映画スタジオで作られたような動画が公開された。(最大、1分間ほど)

まだ、音声対応はできていない

これ実写じゃないの? Soraだけに空恐ろしい。
ただ、各個人の目線をよくみると、おばあちゃんの方を見ていない感じはする。(複数のオブジェクトやキャラクター間の複雑な相互作用をシミュレートすることは難しいとのこと。)

こちらは、看板をみると、作られた感があるがそれでもすごい。

 

OpenAI Sora: Sora | OpenAI
テクニカルレポート:Video generation models as world simulators | OpenAI

上記、公式ページに、たくさんあるデモ動画には、以下のように書いてある。
All videos on this page were generated directly by Sora without modification.(このページのすべての動画は、Soraによって直接生成され、修正されていません。)

よくできている動画と共に、生成が必ずしもうまくいっていない動画も公開している。

各映像の右下には、Soraで作ったことを示すものだろうか?(電子透かし?のようなものがある)

一般公開はいつになるのか? これは、予想が難しい。
「技術的に公開できるレベルにいつなるか? 」というよりも、この技術を使って、「安全性が担保された動画がつくれるか?」(不適切な動画や、選挙妨害や犯罪への利用をどう抑止するかといった問題)を解決する必要がありそうだ。
あとは、Googleや他の陣営の公開するタイミングとの兼ね合いもあるだろう。

部分的な動画作成からだけでも、一般公開して欲しい。

広告

スポンサーリンク

東京郊外を走る電車の窓に映る反射

Generated by Sora

Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.(東京郊外を走る電車の窓に映る反射。)

実写と言われても、わからないレベルだ。

 

映画のトレイラー風

Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.(プロンプト:30歳の宇宙飛行士の冒険を描いた映画予告編。彼は赤いウールの編み込みモーターサイクルヘルメットを着用しています。背景には青空と塩の砂漠が広がり、シネマスタイルで、35mmフィルムで撮影されており、鮮やかな色彩が特徴です。)

広告

スポンサーリンク

マンモス

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.(プロンプト:いくつかの巨大な毛むくじゃらのマンモスが雪の野原を歩いて近づいてきます。彼らが歩くとき、長い毛皮が風に軽くなびきます。遠くには雪に覆われた木々とドラマチックな雪山が見えます。昼下がりの光、繊細な雲と遠く高い位置にある太陽が温かい輝きを生み出しています。低いカメラアングルは驚くべきもので、大きな毛皮の哺乳類を美しい写真撮影で捉えており、奥行きのある画像が特徴です。)

24歳の女性の目(映画風)

Prompt: Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic

これほど、精緻なものがプロンプト一つで作り出せるのか。すごい。映画的な動画の試みもかなり模索している感じがする。

広告

スポンサーリンク

おばあちゃんの誕生日

Prompt: A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle puff, the cake has pink frosting and sprinkles and the candles cease to flicker, the grandmother wears a light blue blouse adorned with floral patterns, several happy friends and family sitting at the table can be seen celebrating, out of focus. The scene is beautifully captured, cinematic, showing a 3/4 view of the grandmother and the dining room. Warm color tones and soft lighting enhance the mood..(きちんと櫛でとかされた灰色の髪の祖母が、カラフルな誕生日ケーキとたくさんのろうそくがある木製のダイニングテーブルの後ろに立っています。表情は純粋な喜びと幸福で、目には幸せな輝きがあります。祖母は前かがみになり、優しい息でろうそくを消します。ケーキはピンクのフロスティングとスプリンクルが施されており、ろうそくの光は消えます。祖母は花柄が飾られた薄い青のブラウスを着ています。テーブルに座る幾人かの楽しそうな友人や家族がぼんやりと祝福しているのが見えます。このシーンは美しく、映画のように捉えられており、祖母とダイニングルームの3/4ビューを示しています。暖かな色調と柔らかい照明が雰囲気を高めています。)

 

 

Weakness: Simulating complex interactions between objects and multiple characters is often challenging for the model, sometimes resulting in humorous generations.(弱点:複数のオブジェクトやキャラクター間の複雑な相互作用をシミュレートすることは、モデルにとってしばしば難しく、時にはユーモラスな生成物が生まれることがあります。)

 

おしゃれな女性が、ネオン街を歩く

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.(おしゃれな女性が、温かい輝きを放つネオンと動く都市の看板がいっぱいの東京の通りを歩いています。彼女は黒のレザージャケット、長い赤いドレス、黒いブーツを身に着け、黒いハンドバッグを持っています。サングラスと赤い口紅をしています。彼女は自信を持って、何気なく歩いています。通りは湿っており、反射して、カラフルな光のミラー効果を作り出しています。多くの歩行者が行き交っています。)

 

カメラは白いビンテージSUVの後ろを追う、道は急な山斜面にある松林に囲まれている

Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.(プロンプト:カメラは白いビンテージSUVの後ろを追います。このSUVは黒いルーフラックがあり、急なダートロードを速く走ります。その道は急な山斜面にある松林に囲まれています。タイヤからは土埃が舞い上がり、太陽光がダートロードを走るSUVに当たり、シーン全体に温かな輝きを投げかけます。ダートロードは遠くにやさしくカーブしており、他の車や乗り物は見えません。道の両側にはレッドウッドがあり、緑のパッチが点在しています。車はカーブをスムーズに追いかける後ろ姿が映され、険しい地形を逞しくドライブしているかのように見えます。ダートロード自体は急な丘と山に囲まれ、上には透き通った青空と細い雲が広がっています。)

 

サイバーパンクな世界でのロボットの生活の物語

Prompt: The story of a robot’s life in a cyberpunk setting.

プロンプト:サイバーパンクな世界でのロボットの生活の物語。

 

 

非現実な映像。アトランティスのように水没したニューヨーク市

Prompt: New York City submerged like Atlantis. Fish, whales, sea turtles and sharks swim through the streets of New York.

プロンプト:アトランティスのように水没したニューヨーク市。魚、クジラ、ウミガメ、サメがニューヨークの通りを泳いでいます。

 

超リアルな眼鏡のおじいちゃん 35mmフィルム、クローズアップ

Prompt: An extreme close-up of an gray-haired man with a beard in his 60s, he is deep in thought pondering the history of the universe as he sits at a cafe in Paris, his eyes focus on people offscreen as they walk as he sits mostly motionless, he is dressed in a wool coat suit coat with a button-down shirt , he wears a brown beret and glasses and has a very professorial appearance, and the end he offers a subtle closed-mouth smile as if he found the answer to the mystery of life, the lighting is very cinematic with the golden light and the Parisian streets and city in the background, depth of field, cinematic 35mm film.(極端なクローズアップで、60代の灰色の髪とひげを持つ男性がパリのカフェに座り、宇宙の歴史について深く考え込んでいます。彼はほとんど動かずに座っており、画面外を歩く人々に目を向けています。彼はウールのコートとボタンダウンシャツを着ており、茶色のベレー帽と眼鏡をかけ、非常に教授らしい外見をしています。最後に、彼は人生の謎に答えを見つけたかのような控えめな閉じた口の微笑を見せます。照明は非常に映画的で、金色の光と背景のパリの街並みと都市が映し出されています。奥行きのある画像、映画の35mmフィルムで撮影されています。)

 

まさに映画のワンシーン。

 

ディズニー? ピクサー? CG,3Dアニメ風

Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

アニメーションのシーンでは、溶けている赤いキャンドルの横でひざまずいている小さくてふわふわしたモンスターがクローズアップで描かれています。このアートスタイルは3Dでリアルであり、特に照明とテクスチャに焦点を当てています。絵のムードは、モンスターが広い目と開いた口で炎をじっと見つめる様子から、驚きと好奇心に満ちています。そのポーズと表情は無邪気さと遊び心を伝えており、まるで初めて周囲の世界を探検しているかのようです。温かい色の使用とドラマチックな照明は、画像の居心地の良い雰囲気をさらに高めています。

 

ディズニー?、ピクサー?風なCG,3Dアニメが映画が作れちゃう? 一部分でもいいので、Soraを一般開放して欲しいー。

同様のプロンプトで、ChatGPT4に絵(静止画)を描いてもらうと、


ChatGPT4

こんな絵がでる。ChatGPT4で、使っている学習データと似ている気がする。

 

出典:
OpenAI Sora: Sora | OpenAI
テクニカルレポート:Video generation models as world simulators | OpenAI

-AI, ChatGPT, Sora

Copyright© テクノロジーの羅針盤 , 2024 All Rights Reserved.