この記事のポイント
- 動画版NanoBananaと言われる最新マルチモーダル動画モデルで生成から編集まで1つのAIで完結
- 「マイ主体」機能で固定キャラクターを登録し、どのシーンでも一貫した人物で動画生成が可能
- Avatar 2.0で1枚の写真から最大5分間の歌って踊れるデジタルヒューマンを作成可能
動画生成AIの世界に革命が起きました。2025年12月1日、中国のAI企業から「Kling O1」がリリースされました。
海外メディアでは「動画版NanoBananaPro」とも呼ばれるこのAI。従来バラバラだった動画生成・編集・理解を1つのモデルで完結できるという画期的な進化を遂げています。
こんな方におすすめ
- 固定キャラクターでシリーズ動画を作りたいクリエイター
- バーチャルYouTuberやMV制作に挑戦したい方
- 動画生成AIの最新技術を活用したいコンテンツ制作者
この記事を読めば、Kling O1の基本機能から「マイ主体」でのキャラクター固定、Avatar 2.0での長尺デジタルヒューマン作成まで完全マスターできます。初心者でも迷わず使える画面付き解説から、料金プラン、競合比較まで包括的に解説していきます。
動画編集ソフトと組み合わせるとさらに便利
無料で使えるAI搭載動画編集ソフト
初心者でもプロ級の動画編集ができる
AI搭載で他で最新の動画編集を体験
Filmora内に動画編集のための豊富な素材が充実

\YouTube動画で見たい方はこちらから/
〜 動画・SNSでも情報発信中!! AIとITスキルでキャリアUPと副業チャレンジ 〜
Kling O1とは?世界初の統合マルチモーダル動画モデル

Kling O1は、中国の大手ショート動画プラットフォームが開発した世界初の統合マルチモーダル動画モデルです。
2025年12月1日にリリースされ、同時にImage O1(画像生成)とAvatar 2.0(AIアバター)もリリース。従来のRunwayやSoraでは動画生成と編集が分かれていましたが、Kling O1なら生成から編集まで1つのAIで完結します。
Kling O1の基本的な特徴は以下のとおり
- 統合マルチモーダル: 生成・編集・理解を1つのモデルで完結
- MVLフレームワーク: Multimodal Visual Languageによる新アーキテクチャ
- マイ主体機能: 正面画像1枚から固定キャラクターを作成
- プロンプト編集: 「通行人を消して」「服を変えて」など自然言語で編集可能
- 最大10秒: 高品質モードで最大10秒の動画生成
- 商用利用可能: 有料プランで商用利用OK
Kling O1は、無料プランでも基本機能を試せますが、本格的に使うにはProプラン(月額約4,100円)以上がおすすめです。
- アクセス方法①:app.klingai.comにアクセスしてアカウント作成
- アクセス方法②:左サイドパネルから「O1」を選択して動画生成画面へ
- アクセス方法③:被写体・シチュエーション・要素を組み合わせて生成開始
なぜ「動画版NanoBananaPro」と呼ばれるのか

Google DeepMindのNanoBanana Proは、画像の精密な編集能力で知られています。テキスト指示だけで画像内の特定要素を自然に変更できる技術です。
Kling O1は、この概念を動画に拡張しました。プロンプトベースで「通行人を消して」「昼から夕暮れに変えて」「主人公の服を変えて」といった指示を出すだけで、マスキングもキーフレームも不要で動画編集ができるのです。
統合されている機能
- Text-to-Video:テキストから動画を生成
- Image-to-Video:画像から動画を生成
- 開始/終了フレーム指定:始点と終点を指定した動画生成
- インペインティング:動画の特定部分を修正
- スタイル変換:動画のスタイルを変更
- カメラワーク拡張:ショットの延長・変更
【革命】「マイ主体」機能で固定キャラクターを作る

Kling O1の最も革命的な機能が「マイ主体」です。
動画生成AIの最大の課題は「キャラクターの一貫性」でした。同じキャラクターを複数のシーンで登場させようとすると、顔が変わったり服装がバラバラになったりしていました。
「マイ主体」機能を使えば、正面画像1枚から多角度のキャラクターデータを自動生成し、どんなシーンでも同一人物を一貫して登場させることができます。
step
1被写体メニューを開く
Kling O1の画面左メニューから「マイ主体」をクリックします。ここで自分だけのオリジナルキャラクターを登録できます。

step
2「+」ボタンで新規登録画面を開く
「+」ボタンをクリックすると、新規キャラクター登録画面が表示されます。ここに固定したいキャラクターの画像をアップロードします。

step
3キャラクター画像をアップロード
正面からの1枚の画像をアップロードします。

おすすめの画像:
- 正面を向いている
- 顔がはっきり見える
- 高解像度(1024×1024ピクセル以上)
- バストショット(胸元から上)
step
4AIスマートフォーカスを実行
「AIスマートフォーカス」ボタンをクリックすると、AIが自動的に分析を開始。正面だけでなく、斜め横、サイド、後ろからのアングルまで自動生成してくれます。
今回アップロードした画像がこちら


step
5最適なものを選択して登録
一番多角度をカバーしているものを選択して登録すれば設定完了です。これ以降、どんな動画を作っても同じキャラクターが安定して登場します。
「マイ主体」の活用シーン
- シリーズ動画:同じキャラクターが毎回登場するコンテンツ
- ストーリー動画:複数シーンで一貫したキャラクターが活躍
- バーチャルインフルエンサー:固定キャラクターによるSNS発信
- 教育コンテンツ:同じナビゲーターが解説するシリーズ教材
【実践】Kling O1で動画を生成してみよう

それでは、実際にKling O1を使って動画を生成していきましょう。
Kling O1の動画生成は、パーツを組み合わせる直感的なUIが特徴です。
step
1O1モードを選択
左メニューから「O1」をクリックして、動画編集画面を開きます。初めての人は使いづらさを感じるかもしれませんが、1回使えばすぐ慣れます。

step
2被写体を選択
「マイ主体」から、先ほど登録したキャラクターを選択します。選択するだけで、このキャラクターを使って動画を生成できます。

step
3追加要素を設定
「参照元」をクリックして、追加要素を設定します。例えば「リビングルームで」「猫と一緒に」「カピバラと」などを指定できます。

画像のアップロードなどでも同様にプロンプト内に情報が認識され、テキストと組み合わせて動画の生成が可能になっています。
step
5動画設定を行う
生成する動画の設定を行います。

設定項目:
- 高画質化:オン/オフ(Proプランで選択可能)
- 秒数:5秒または10秒(最大)
- アスペクト比:16:9、9:16、1:1など
- 生成本数:1〜4本(一度に生成)
step
6生成ボタンをクリック
「生成」ボタンをクリックすると、動画の生成が始まります。Proアカウントの場合、1回の動画生成で約30〜35クレジットを消費します。

追加した素材を読み取って動画内に差し込んでくれるリファレンス機能として動画を生
成してくれます。人物の一貫性を保ったり 、参照した画像の対象物を取り入れて動画の生成を行なってくれます。
音声の追加方法
Kling O1の動画生成では、音声は後から追加する必要があります。
- リップシンク:音声ファイルをアップロードしてキャラクターに合わせる
- テキスト読み上げ:読み上げたいテキストを入力してAIが音声生成
注意:開始フレームと終了フレームを両方指定したい場合は、音声同期をオフにする必要があります。
Image O1:高品質画像生成機能

Kling O1では、動画だけでなくImage O1として画像生成も可能です。
最大2K解像度の高画質画像を、一度に最大9枚まで生成可能。動画の素材として使用できるため、ワークフローがスムーズになります。
step
1画像生成メニューを開く
左メニューから「画像生成」をクリックします。

step
2入力方法を選択
テキストから生成、参照画像から生成、スタイル変更など、目的に合わせて選択します。

step
3スタイルを選択
用意されたスタイルから選択します。アニメ調、写実的(フォトリアル)、人形風、イラスト調など多数あります。

step
4生成枚数を指定して実行
1〜9枚の範囲で指定し、「生成」ボタンをクリックして完了です。
生成できた画像がこちら

画像の生成性能かなり良い感じでした。かなりのクオリティで画像を作り上げてくれます。
また作成した画像をそのまま動画に変換することもできます。 ツール内の移動が不要で、シームレスに画像生成から動画生成が行えます。
DeepSeek連携機能

画像生成画面には「DeepSeek」ボタンがあります。
- プロンプトのアイデアを出してもらう
- より効果的なプロンプトに改善してもらう
- 画像のコンセプトを壁打ちする
おすすめの使い方は、Image O1で生成した画像を動画生成の参照画像として使うことです。同じプロンプトでもスタイルを変えるだけで全く違う雰囲気の画像が生成されるので、比較しながらベストなものを選べます。
【革命】Avatar 2.0で歌って踊るデジタルヒューマンを作成

Kling O1と同時にリリースされた「Avatar 2.0」は、1枚の写真から最大5分間のデジタルヒューマン動画を生成できます。
従来のAIアバターは「顔面麻痺」と揶揄されることもありましたが、Avatar 2.0は表情と動きの表現が大幅に進化しています。
Avatar 2.0の技術スペック
| 項目 | スペック |
|---|---|
| フレームレート | 48fps(業界平均以上) |
| 解像度 | 1080p HD |
| 最大動画長 | 5分 |
| 対応言語 | 日本語、英語、中国語、韓国語 |
| 対応キャラクター | 実写、AI生成画像、アニメ、動物 |
step
1アバター2.0メニューを開く
左メニューから「アバター2.0」をクリックします。

step
2喋らせる人物を選択
以下の方法で人物画像を指定します。
- 画像アップロード:自分の画像をアップロード
- ライブラリ:用意されたモデルから選択
- AI生成:その場で新しい人物を生成
- 履歴:過去に使用した画像から選択
ライブラリの項目では、あらかじめ用意されたモデルから音声とセットで選ぶことができるため、手軽にアバターを作成できます。
step
3音声を設定
音声ファイルをアップロードするか、テキストを入力して読み上げ音声を生成します。Suno AIで生成した音楽をそのままアップロードすることも可能です。

個人的にはテキストから音声の生成をしてしまうと少しぎこちない感じになるのでお勧めしません。
音声生成AIなどを用いて音声のアップロードがおすすめです。
step
4設定を調整して生成
アバターをどのように動かしたいか、表現してほしいかを打ち込みましょう。それができたら、生成本数と品質モード(標準/高品質)を選択し、「生成」ボタンをクリックします。

Avatar 2.0の表現力
表情の自然さ:
- 笑い、怒り、困惑、強調などの感情を自然に表現
- 文脈に応じた表情の変化
全身の動き:
- 頭だけでなく、肩をすくめる、ジェスチャーをするなどの動作
- 話す内容に合わせた自然な身振り
音楽への対応:
- リズムに合わせて体を動かす
- サビで盛り上がり、間奏で落ち着く
- パフォーマンスとしての表現
今回は音楽生成AI「SunoAI」と組み合わせて、AIアバターの作成と動画の生成を行いました。
アバターの精度としてもかなり高く、ものすごく自然に音楽を口ずさんでくれました。
最大5分まで対応しているので、音楽1曲まるまる歌わせることが可能です。バーチャルYouTuberやMV制作、Eコマースの商品紹介動画など、活用シーンがかなり広いと思います。
料金プラン:どのプランを選ぶべきか

Kling AIは無料プランでも基本機能を試すことができます。しかし、本格的に使うには有料プランへの登録がおすすめです。
Kling AIの料金プラン
| プラン | 月額料金 | クレジット/月 | 特徴 |
|---|---|---|---|
| 無料 | 0円 | 66〜166 | 透かしあり、機能制限あり |
| Standard | 約1,500円 | 660 | 入門向け、基本機能が使える |
| Pro | 約4,100円 | 3,000 | おすすめ。高品質モード対応 |
| Premier | 約13,800円 | 8,000 | ヘビーユーザー向け |
| Ultra | 約24,000円 | 15,000 | 業務利用・プロダクション向け |
おすすめはProプラン
- 3,000クレジットで十分な本数が生成可能(高品質10秒動画なら約40本)
- 高品質モードが使える(1080pの高解像度動画)
- コストパフォーマンスが良い(1クレジットあたり約1.4円)
年額プランについての注意:動画生成AI業界はアップデートが非常に激しいため、1年後にはより優れたサービスが登場している可能性があります。まずは月額プランで試してから判断することをおすすめします。
競合サービスとの比較

結論として、「どれか1つが最強」というわけではありません。用途に応じた使い分けが最適解です。
| 項目 | Kling O1 | Sora (OpenAI) | Runway Gen-4 | Veo 3 (Google) |
|---|---|---|---|---|
| 強み | 画像→動画変換、キャラ一貫性 | ストーリーテリング、長尺 | 編集ワークフロー統合 | 音声同時生成 |
| 最大秒数 | 10秒 | 20秒 | 10秒 | 8秒 |
| 音声対応 | 後付け | 対応 | 後付け | ネイティブ対応 |
| アクセス | 一般公開 | 招待制/地域限定 | 一般公開 | 招待制/地域限定 |
| 月額料金 | 約1,500円〜 | 約3,000円〜 | 約1,500円〜 | 未公開 |
ユースケース別おすすめ
- 固定キャラでシリーズ動画を作りたい:Kling O1
- 長尺のストーリー動画を作りたい:Sora
- 既存の動画編集ワークフローに組み込みたい:Runway
- 音声付き動画を一発で作りたい:Veo 3
- コスパ重視で高品質動画を作りたい:Kling O1
AIアバター作成ならこれもオススメ!
Top ViewAI
DomoAI
まとめ:Kling O1で始まる新しい動画制作の世界

以上、Kling O1の使い方を徹底解説しました。
Kling O1は、単なる動画生成ツールを超えた「次世代のコンテンツ制作プラットフォーム」です。
Kling O1の3大メリット
- 世界初の統合マルチモーダル動画モデルで生成から編集まで1つのAIで完結
- 「マイ主体」機能で固定キャラクターを登録し、どのシーンでも一貫した人物で動画生成が可能
- Avatar 2.0で1枚の写真から最大5分間の歌って踊れるデジタルヒューマンを作成可能
特に「マイ主体」機能での固定キャラクター、Avatar 2.0での長尺デジタルヒューマン生成は、これまでの動画生成AIにはなかった機能で、クリエイターにとっては大きな武器になります。
今ならKling O1は無料プランで基本機能を試すことができます。まずはあなたのアイデアを形にして、Kling O1の威力を体験してみてください。
こちらの動画もおすすめ
おすすめAIツール
DomoAI無料体験こちら
10%OFFクーポンコード:7VVTQQZ5
年間プランが最大40%OFF
おすすめ動画編集ソフト
無料で使えるAI搭載動画編集ソフト
初心者でもプロ級の動画編集ができる
AI搭載で他で最新の動画編集を体験
Filmora内に動画編集のための豊富な素材が充実
**ディスクリプション(108文字)**
2025年12月リリースのKling O1は動画生成・編集・理解を統合した革命的AI。固定キャラ機能やAvatar 2.0の使い方、料金プラン、競合比較まで徹底解説します。
**タグ**
Kling AI,Kling O1,動画生成AI,AI動画編集,Avatar 2.0,AIアバター,Kuaishou,快手,NanoBananaPro,動画版NanoBanana,マルチモーダルAI,Text-to-Video,Image-to-Video,AIクリエイティブツール,生成AI
**キーワード**
Kling O1,Kling AI 使い方,Kling AI 料金,動画生成AI 比較,Avatar 2.0,Kling O1 vs Sora,動画版NanoBananaPro,AIアバター 作り方,Kling AI 固定キャラ,マルチモーダル動画AI

