GoogleGemini3で動画制作を手伝ってもらう

こちらのHPもYouTubeも全てChatGPTのディレクションで完成していたのだけど、今回、Gemini3にお願いしてみた。

まず、先日作成したAntigravityの画像現像システムで現像。望遠レンズのカメラはCR3なのだけど、広角レンズはレガシーカメラなのでCR2。まさか違いがあるとは思わなかったのだけど(十分違うわな。拡張子でファイルを見ているわけで)CR2もすぐに対応をしてくれた。
が、出て来たJPGファイルが暗い。CameraRawを開くとXMPファイルは作成されているのに、その適用ができないまま現像されているということらしい。
Gemini3にも状況を共有したが、なかなか良いプロンプトがなく、最終的にはCR2は別で作ることにした。
CR3用とCR2用で分けて、CR3がやったように1枚からXMPファイル作成、プレビュー確認を行うことを行った。Geminiの指示は次だった。

このCR2フォルダ内の1枚に対して、テスト現像を行ってください。

指示内容:

  1. AI分析とXMP作成: AIがこの画像に最適な露出を判断し、新しいXMPファイルを作成してください。
  2. プレビュー表示: そのXMP設定を適用したプレビュー画像を生成し、チャットで見せてください。
  3. 確認待ち: 私が画像を見て「OK」と言うまで、一括処理(バッチ処理)は絶対に開始しないでください。

まずはこの1枚の結果を見せてください。

この最後の1文があるかないかでAIは勝手に動き出す。一からするからってことを認識はしてないのか、暴走モード突入するから必要。

ただ、出て来たプレビューが恐ろしく暗い。

XMPファイルの設定とまるで違っているよね?ってことで、Geminiの指示は次。

プレビューを確認しましたが、まだ全体的に暗すぎます。

以下の通りに設定を修正して、もう一度プレビューを見せてください:

  1. 露出(Exposure)の大幅アップ: 現在の +0.35 では足りません。思い切って +1.50 前後まで上げて、もっと明るく開放感のある見た目にしてください。
  2. シャドウの引き上げ(Shadows): 暗い部分のディテールが見えるよう、Shadowsをさらにプラス側に振ってください。
  3. 確認: この修正を反映した新しいプレビュー画像を再度生成してください。

納得のいく明るさになるまで、バッチ処理(一括処理)には進まないでください。

XMPの数値は変わったのに、プレビューが変わってない・・・。

プレビュー画像に設定が反映されていないようです(画像が暗いままです)。

数値(+1.50)が正しいか確認したいので、以下の操作をお願いします:

  1. この1枚に対して、実際にJPEGを書き出して「OK」フォルダに保存してください。
  2. 保存ができたら教えてください。私がFinderで直接そのJPEGを開いて、明るさを確認します。
  3. まだ一括処理(バッチ)には進まないでください。

おっと。保存は反映されているような。まぁ白飛びさせちゃってるよね?はあるけど。しかもOK/NG判定も勝手に入っている。素晴らしい。

それでもその後、一気にフォルダ内ファイルを現像させたところ、まぁそこまで気になるレベルではなかったのでここで終了とした。

次にPremiere Proの編集の手伝いをしてもらった。

と言っても、自動化するには難しい。一番大変なのは、音声処理。私は会話は全て削除したいので、今までは全部聞いてカットしていたのだけど、Geminiが教えてくれた方法が画期的だった。(普通なのかもしれないけど、知らない人間には画期的)

「文字起こしベースの編集」で一括カット

そっか。文字起こしをして、出て来たリストでその箇所をDeleteすると映像ともに消える。それはダメでしょ。でも、対象の場所にジャンプするからその部分の音声部分だけをカットしていけたからかなり効率的。
まぁため息とかちょっとした笑い声は難しかったけど。

3. 会話の「声」だけを消して、環境音を残したい場合

もし「会話のシーン自体は残したいけれど、声だけ消して水の音は残したい」という高度な編集をしたい場合は、以下の方法があります。

  • Adobe Podcast (Enhance Speech): 本来は声をクリアにするAIですが、設定を調整することで背景のノイズ(水の音など)と声を分けるヒントになります。
  • UVR5 (Ultimate Vocal Remover): 無料の外部ツールですが、AIが「人の声」と「それ以外の音」を分離してくれるため、声だけを消したカヌーの音を作ることが可能です。

こんな方法もあるみたいだから、次回、試してみよう。

次は「消した会話の部分の穴埋め」について

1. 別の場所から「水の音」をコピーしてくる

会話がない、綺麗な「水の音だけ」が流れている場所を探します。

  • 手順:
    • タイムライン上の「水の音だけ」のクリップを Alt (Windows) または Option (Mac) を押しながらドラッグして、会話を消した部分の真下のトラック(A2など)にコピーします。
    • コピーした音を、会話を消して「無音」になった隙間に当てはめます。
2. 「コンスタントパワー」で音の継ぎ目を消す

音を置いただけでは、つなぎ目で「プチッ」というノイズが乗ることがあります。これを滑らかにつなぎます。

  • 手順:
    • [エフェクト] パネルを開き、「オーディオトランジション」>「クロスフェード」>**「コンスタントパワー」**を探します。
    • これを、音のクリップ同士の「継ぎ目」にドラッグ&ドロップします。
    • これで、前の音がフェードアウトし、次の音がフェードインして自然に混ざり合います。

こんな方法知らなかったわ。

もし、水の音が足りなかったり、場所によって音の種類(激しい音、静かな音)が違って繋ぎにくい場合は、「オーディオのリミックス」というAI機能を使って、短い水の音を自動で長く伸ばす方法もあります。

とかって入れてくるの。それっていい!!って感じなんだけど、最後に入っているから、まず上からやるんだよね。だから、これは最後にやり直して対応しました。

写真を最後に並べることにしたのだけどそのアドバイスもすごかった。

1. 写真の表示時間を一括設定

並べる前に、写真1枚あたりの長さを決めておくと楽です。

  • [設定](MacならPremiere Proメニュー、Winなら編集メニュー)[環境設定][タイムライン] を開きます。
  • 「静止画のデフォルトのデュレーション」 を、例えば「3.0秒」や「4.0秒」に設定します。
  • これで、これからタイムラインに置く写真がすべて指定した長さになります。
2. 写真を並べて「フレームサイズ」を合わせる
  • 望遠カメラの写真をすべて選択して、動画の最後にドラッグ&ドロップします。
  • 写真のサイズがバラバラな場合は、タイムライン上の写真をすべて選択して右クリック > 「フレームサイズに合わせる」 を選ぶと、画面内にぴったり収まります。
3. 「オートカセット」で動きをつける(おすすめ!)

ただ切り替わるだけでなく、写真が少しずつ動く(パン&ズーム)と一気にプロっぽくなります。

  • タイムラインの写真を選択した状態で、上部メニューの [クリップ] > [ビデオにオートカセット] (または「シーケンスへオート」)のような項目があれば便利ですが、より簡単なのはエフェクトのコピペです。
  • 1枚目の写真に「スケール」のキーフレーム(開始100%→終了110%など)を打ち、その設定をコピーして、残りの写真に「属性をペースト」すれば、すべての写真に一瞬で動きがつきます。

多分、興味があったり向上心があればYouTubeで見て勉強したりするのだろうけど、特にそんなこともなかったから、そんなことが出来るんだ。ってど素人丸出しです。
まぁ出来るのだろうけど、想像しなきゃ無理ね。
他の人の動画を見て、「あ、こういう風にしてみたい」とかね。でも、私のYouTubeって見るより聴くなんだよね。

そして次は

設定と配置のコツ
  1. 環境設定を変更: 先ほどお伝えした通り、[環境設定] > [タイムライン] で「静止画のデフォルトのデュレーション」を 4.0秒 に書き換えます。
  2. 一度並べた写真は削除して置き直す: すでにタイムラインに並べてしまった写真は、設定を変えても自動では伸びません。設定変更後に、再度プロジェクトパネルから写真をドラッグ&ドロップして並べ直してください。
  3. 「クロスディゾルブ」を一括適用:
    • 並べた写真をすべて選択します。
    • ショートカットキー Ctrl + D (Windows) / Cmd + D (Mac) を押すと、すべての写真の繋ぎ目に「ふわっと切り替わる効果(クロスディゾルブ)」が一括で適用されます。
    • ※もし適用されない場合は、エフェクトパネルで「クロスディゾルブ」を右クリックして「デフォルトのトランジションに設定」となっているか確認してください。

ところどころ、キーワードが入ってくるのだけど、「え?それって・・・」ってなるからいちいち質問をする。

「オートカセット」で動きをつける(おすすめ!)をもう少し詳しく教えてください

ステップ1:最初の1枚に「動き」を作る

まず、並べた写真の先頭の1枚だけを使って、ベースとなる動きを作ります。

  1. タイムラインで1枚目の写真を選択し、**「エフェクトコントロール」**パネルを開きます。
  2. 再生ヘッドをその写真の一番最初に合わせ、**「スケール」**の横にある時計アイコン(キーフレーム)をクリックします(値は 100 )。
  3. 再生ヘッドを写真の一番最後(4秒後)に動かし、「スケール」の値を 110〜115 程度に上げます。
    • これで「ゆっくりズームする」動きが1枚完成しました。
ステップ2:すべての写真にその動きを「一括コピー」する

ここが時短のポイントです。

  1. 動きを作った**1枚目の写真を右クリックして「コピー」**を選択します。
  2. タイムライン上の残りの写真(2枚目以降すべて)をマウスでドラッグして一括選択します。
  3. 選択した状態で**右クリック > 「属性をペースト」**を選択します。
  4. 出てきたウィンドウで「ビデオエフェクト」の**「モーション」にチェックが入っていること**を確認して「OK」を押します。

結果: これだけで、すべての写真に「4秒かけてゆっくり110%までズームする」という動きがコピーされます。

まじか。そんな方法があるなんて。

画角違いのピラーボックス対応とかもせっかくなのでやってみました。
まだまだあるのですが、それはまた今度ってことで。

写真のBGMでまたオーディオのリミックス機能が出て来ました

3. オーディオのリミックス機能を使う(時短ワザ)

もし「ここだけは音が綺麗だ」という短い(例えば数秒の)水の音が見つかったら、Premiereの 「リミックスツール」 を使ってみてください。

  • ツールバーの「リップル編集ツール」を長押しして「リミックスツール」を選び、短い音クリップの端をダイジェストの長さまでびよーんと伸ばします。
  • AIが音を解析して、つなぎ目がわからないように自然に音を長く生成してくれます。

リミックスツールって何?

リミックスツールは、Adobe Premiere Proに搭載されているAI(Adobe Sensei)を活用した画期的な音声編集機能です。

一言で言うと、**「短い音声素材を、映像の長さに合わせてAIが自然につなぎ合わせて自動で伸ばしてくれる(または短くする)」**ツールです。

カヌーの動画で「数秒しかない綺麗な水の音」を、数分間のダイジェスト全体に広げたい今の状況にはまさに最適です。

リミックスツールの使いかた
  1. ツールを選択する:
    • ツールパネル(通常、タイムラインの左側にあるボタン群)にある「リップル編集ツール」(ショートカット:B)を長押しします。
    • 出てきたメニューの中から [リミックスツール] を選択します。
  2. 音声を伸ばす:
    • タイムライン上にある「短い水の音」のクリップの右端をクリックしたまま、ダイジェストの最後まで右にぐーっとドラッグして伸ばします。
  3. AIが自動計算:
    • ドラッグを離すと、AIが音の波形を瞬時に解析します。
    • 継ぎ目が目立たないように音を切り貼りし、指定した長さにピッタリ収まるように音声を再構成します。

リミックスツールの音を最後フェードアウトさせられないの?

1. 「エフェクト」で自動的にかける(一番簡単)
  • [エフェクト] パネルを開き、「オーディオトランジション」>「クロスフェード」>**「コンスタントパワー」**を探します。
  • これを、リミックスした音声クリップの**一番最後(右端)**にドラッグ&ドロップします。
  • 配置されたエフェクトの端を左右にドラッグすると、フェードアウトの長さを調整できます。

これも知らなかった。今まで手動でやってましたよ。

倍速で確認ってできないのかな?

Premiere Proで作業中ですね。倍速再生(早送り確認)は、キーボードのショートカットを使うのが最も一般的で便利です!

以下のキーを覚えておくと、編集スピードが劇的に上がります。

1. 「J・K・L」キーを使う(標準の操作)

キーボードの右側にあるこの3つのキーで、再生速度を自在にコントロールできます。

  • L キー:再生 / 倍速再生
    • 1回押すと「等倍」で再生。
    • **2回、3回と連打するたびに「2倍速 → 4倍速 → 8倍速…」**と早くなります。
  • K キー:停止
  • J キー:逆再生 / 逆倍速再生
    • 1回押すと「逆再生」。
    • 2回、3回と連打すると「逆向きに倍速」で戻ります。

まじかー。

YouTube用の字幕ってPremiereProでできたりしないの?

以下の手順で、YouTubeにアップロードするための「字幕ファイル(.srt)」を作成してください。

1. 字幕(キャプション)を生成する

まずは、先ほどお伝えした手順でタイムライン上に字幕を生成します。

  • [テキスト]パネル[キャプションを作成] をクリック。
  • ※会話をカットした後の最終的な音声に合わせて、再度「文字起こし」をしてから作成すると、タイミングがズレません。
2. 「.srt」ファイルとして書き出す

YouTubeが読み込める形式で、字幕データだけを保存します。

  1. [テキスト]パネルの右上にある […](三点リーダー) をクリックします。
  2. [書き出し][SRT ファイルに書き出し…] を選択します。
  3. 保存先を選んで、適当な名前(例:toro-lake-subtitles.srt)を付けて保存します。

いつもYouTubeで動画をアップロードしてから手入力してました。そこで変なところを見つけると、アップロードしたコンテンツを削除して・・・ってアホなことをしてました。PremiereProでできると、最終確認ができて修正もできて良いです。

もしかしたら、最初に文字起こしから字幕を作成して、音声カットが一番いいのかもしれない。次回試してみよう。

サムネイル作成もタイトル、概要も全部お任せです。ただサムネイル用の画像を渡すと勝手に作成してくれるのだけど・・・漢字が適当すぎる。

画像の補正、文字入れまでをして提供してくれるのだけど、そこは、文章でください。
3パターンほど提供してくれました。
フォント、配置場所、色、ドロップシャドウについても指示があります。
CameraRawを教えてくださいと言っても、また補正しちゃうし。

いやいや・・・文字入れは私がしなきゃだから、設定値を教えてください。

等のやりとりで完成したYouTubeがこちらになります。


Gemini3はマイナス10度の世界にしたかったようなのですが、この日の気温は多分2、3度。風もなく、完全な防寒着で暑いくらい。帽子も耳当てもせずに居られるほどでした。
それでこの景色を見られるのは贅沢ですね。

アレキナイ川がなぜ凍らないのか?

  • 安定した水温の湧き水 地下水は外気の影響を受けにくいため、冬でも凍結しない程度の温度(数度〜10度前後)を保っています。この温かい湧き水が川に供給され続けることで、水面が凍るのを防いでいます。
  • 川の短さと流れ アレキナイ川は塘路湖(とうろこ)と釧路川を結ぶ非常に短い川です。湧き水が冷え切る前に釧路川へ合流するため、凍結する暇がないという側面もあります。
  • 穏やかな流れ 一見すると流れが止まっているように見えるほど穏やかですが、実際には常に水が入れ替わっているため、氷が張りにくい状態が維持されています。

冬のアレキナイ川の魅力

この「凍らない」という特徴のおかげで、アレキナイ川は冬の釧路湿原において非常にユニークな景色を見せてくれます。

  • 冬のカヌー体験 多くの川が凍って閉ざされる中、アレキナイ川では真冬でもカヌーを楽しむことができます。水面が鏡のように周囲の雪景色を映し出す様子は絶景です。
  • 幻想的な「霧氷」と「けあらし」 外気温が非常に低く(マイナス20度など)、水温の方が高い場合に、水面から蒸気が上がる「けあらし」や、その蒸気が木々に付着して凍る「霧氷(むひょう)」が見られます。

豆知識: アレキナイ川の名前は、アイヌ語の「アレ・キ・ナイ(魚を獲る仕掛けのある川)」に由来していると言われています。冬でも凍らないこの川は、古くから動植物や人々にとって大切な場所だったことが伺えますね。

凍らないということはいつでも魚をゲット出来るので、鳥も集まってくるということのようで往路ではたくさんの鳥を撮影できました。
動画と写真と両方をやっているので、写真モードになると動画がなくなってしまうのですが、後半にまとめてあげてみました。
今まではカットインさせていたのですが、景色があまりにも良かったのでなるべく流れを壊したくないなって思いまして。

この日は、私自身初めて「オオワシ」を撮ったのですが、オジロワシ以上に動かないので撮り放題でした。カラスに追われて雪上にいるのは珍しいのかもしれませんが、自然とはそんなものなのでしょうね。

コメントを残す