nanobanana+InDesignで絵本作成
nanobanana(Gemini 2.5 Flash Image)を使った絵本制作の具体的な手順
nanobananaの具体的な操作画面や利用方法は利用するプラットフォーム(Geminiアプリ、API、特定のウェブサービスなど)によって若干異なりますが、基本的な考え方は同じです。
1. 準備:スタイルとキャラクターの固定
-
キャラ設定カードの準備:
-
Stable Diffusionの時と同様に、顔アップ、全身、服の色コードなどを含めた**「キャラ設定カード」画像(
character_card_main.pngなど)**を用意します。
-
-
ベースプロンプトの決定(固定化):
-
絵本の絵柄(スタイル)、キャラクターの特徴、色指定を盛り込んだ基本プロンプトを作成します。
-
例(スタイル):
children's book illustration, warm gentle colors, simple background, soft lines, watercolor-like style -
例(キャラ):
a girl with black bob hair, round eyes, yellow T-shirt (#F7D23A), red shoes (#C93333)
-
-
ネガティブプロンプトは、nanobananaはStable Diffusionほど必要ありませんが、あれば効果的なものを固定します。
-
例(ネガティブ):
blurry, extra fingers, deformed hands, text, watermark
-
-
2. ベース画像の生成(理想の顔の作成)
-
nanobananaの画像生成機能(Text-to-Image)で、**「基本プロンプト」**を使って最初の画像を生成します。
-
気に入った顔と絵柄の画像を1枚選び、**「親画像」**として保存します。(例:
base_face_v01.png)
3. 挿絵の量産(一貫性の維持)
ここがnanobananaの最大の強みを発揮する部分です。**「参照画像(Reference)」と「プロンプトの調整」**を組み合わせて使用します。
-
参照画像の適用(顔のロック):
-
カットごとのプロンプトの変更:
-
「基本プロンプト」のスタイルとキャラクター部分(色コードも含む)はそのまま維持し、ポーズ、背景、アクションの部分だけを変更します。
-
プロンプト例(変更前):
...girl... stands on a sunny hill. -
プロンプト例(変更後):
...girl... is sitting on a big red chair, reading a book.
-
-
-
構図の調整(ControlNetの代替):
4. 部分的な修正(Inpaintの代替)
-
生成された画像で、指や小物など特定の部位だけを修正したい場合、nanobananaの**「編集」**機能(Inpaint/Outpaintの代替)を使用します。
-
修正したい部位を**マスキング(またはブラシ)**で指定するか、自然言語で場所を特定し、プロンプトで修正内容を指示します。
-
指示の例(マスキング不要な場合もあり): 「彼女の右手の指が6本になっているので、自然な5本に直して」
-
指示の例(Inpaintの代替): 「彼女の持っているカバンを、青いカバンに変更して」
-
5. レイアウト・印刷準備
-
生成された画像をダウンロードします。
-
Stable Diffusionの時と同様に、Adobe InDesignなどのレイアウトソフトで裁ち落とし(塗り足し)やマージンを設定し、ページ番号や文字のスタイルを統一して配置します。
-
印刷所指定のプロファイルに合わせてPDFを書き出します。
nanobananaの最大の利点は、Stable Diffusionで必要だった複雑なツールのインストール(A1111, kohya_ss, ControlNet拡張など)や、LoRA学習、Denoising strength/Seedなどの数値調整を最小限に抑え、プロンプトと参照画像だけで高い一貫性を実現できる点です。
Stable Diffusion+InDesign=絵本
0) “キャラ設定カード”を作る(最初に1回)
目的: 顔・服・色を固定して、ページごとのブレを止める土台を作る。
-
1枚の画像にまとめる(PNG/JPG、1024×1024 目安)
-
顔アップ(正面)・全身(正面/横)・後ろ姿(必要なら)
-
服・髪・小物の色コードも書く(例:髪 #222222、服 #F7D23A、靴 #C93333)。
-
-
この画像は後で**Reference(参照)**や色指定の見本に使う。
→ ファイル名例:character_card_main.png
1) LoRA(絵柄スタンプ)を作る
1-1. 学習用画像を整える
-
あなたの絵のみを30〜100枚集める(他人の作品は混ぜない)。
-
画像編集ソフトで:
-
フォルダを作る:
-
各画像と同名の
.txtをcaptions/に用意し、短文で統一:※ ほぼ同じ文章でOK(“絵柄”を学ばせたいから)
1-2. ツールの準備(Windows)
-
A1111(Automatic1111 WebUI)
-
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git -
webui-user.batをダブルクリック → 初回は自動セットアップ → ブラウザで開く
-
-
ベースモデル(SDXL)
-
stable-diffusion-webui/models/Stable-diffusion/にsd_xl_base_1.0.safetensorsを置く
-
-
ControlNet拡張(後で使う)
-
A1111上部 Extensions → Install from URL
-
URL:
https://github.com/Mikubill/sd-webui-controlnet→ Install → Apply and restart UI
-
-
kohya_ss(LoRA学習GUI)
-
git clone https://github.com/bmaltais/kohya_ss.git -
setup.bat→ 終わったらgui.batで起動
-
1-3. kohya_ssで学習(SDXLの例)
-
ブラウザのkohya_ss GUIで:
-
Base model:
sd_xl_base_1.0.safetensorsを指定 -
Network type:LoRA を選択
-
Train data:
-
画像フォルダ:
dataset/my_style -
キャプション:
dataset/captions
-
-
-
設定(最初の目安):
-
Image size:
1024 -
network_dim(rank):
16 -
network_alpha:
16 -
learning rate:
0.0001(弱めたい時は0.00005) -
batch size:
1(VRAMに余裕あれば2) -
repeats/steps:画像50枚なら repeats 10(=1epoch=500サンプル)から試す
-
-
Start を押す → 終了後、
output/にmy_style_lora.safetensorsができる(これが絵柄スタンプ)。
2) 挿絵生成(ブレを抑えて量産)
2-1. A1111の基本テンプレを作る(固定値)
-
A1111を起動 → txt2img タブ。
-
右側パネルで固定:
-
Sampler:
DPM++ 2M Karras -
Steps:
28(±5は可) -
CFG Scale:
5.5〜7.0(まずは6.5) -
Size:
1024 × 1024 -
Seed:任意の整数を固定(例:
123456789。-1は使わない)
-
-
LoRAの読み込み
-
stable-diffusion-webui/models/Lora/にmy_style_lora.safetensorsを置く -
画面の 🧩 LoRA から選ぶ
-
-
プロンプトテンプレ(メモリして毎回コピペ)
ネガティブ
色コードをカッコで添えると、色ブレが減る。
2-2. “理想の顔”のベース1枚を作る
-
上のテンプレで何枚か出す → 一番しっくり来る顔を選ぶ
-
ファイル名:
base_face_v01.png(以後の親画像)
2-3. img2imgで別カットを量産(いちばん安定)
-
img2img タブ →
base_face_v01.pngをドラッグ。 -
右側設定:
-
Denoising strength:
0.45(範囲は0.35〜0.55。小さいほど顔保持) -
ほか(Sampler/Steps/CFG/Seed/Size)はテンプレと同じ
-
-
プロンプトは「背景・ポーズ・小物」だけ変える(顔・服・色の言い回しは固定)
-
これで「同じ顔の別ポーズ」画像が量産できる。
2-4. ControlNetでラフを清書(構図が大きく違う時)
-
ControlNet セクションを開く → Enable をON。
-
画像にラフ(下絵)を入れる(スマホ撮影でもOK)。
-
設定:
-
Preprocessor:
scribble(ダメならlineart) -
Model:対応するControlNetモデル
-
Weight:
0.7(範囲0.6〜0.8)
-
-
LoRAの重みはやや控えめ(
<lora:my_style_lora:0.7〜0.8>)。 -
生成 → ラフ通りの構図で、あなたのタッチに清書。
2-5. Reference(参照)で顔をロック
(拡張やControlNetの「Reference」系機能を想定)
-
参照にキャラ設定カードの「顔アップ切り抜き」を指定。
-
Weight を
0.8前後に。 -
生成 → 目・鼻・髪色が見本に近づく。
-
参照が暗い/粗いとうまくいかない → 明るく・はっきりさせる。
-
2-6. **OpenPose(ControlNet)**でポーズ固定(必要に応じて)
-
ControlNetの Preprocessor を
openposeに切替。 -
人の骨格線(スティック図)を指定して生成。
-
体のブレが消える → 顔の安定にも効く。
2-7. 崩れをピンポイント修正(Inpaint / ADetailer)
-
ADetailer:出力後に自動で顔を整える(A1111拡張)。
-
Inpaint(img2imgの一種):
-
img2img → Inpaint を選択
-
絵を読み込み、直したい部位だけブラシで塗る(例:手指)
-
Denoising 0.35〜0.55、Inpaint area: only masked、Masked content: original
-
生成 → その部分だけ自然に描き直し。
-
3) InDesignでレイアウト&PDF出力
3-1. ドキュメント作成
-
ファイル → 新規 → ドキュメント
-
サイズ:例
148 mm × 148 mm(単ページ) -
裁ち落とし(塗り足し):上下左右 3 mm
-
マージン:上下左右 10〜15 mm(文字や大事な絵はここに収める)
-
-
マスターページに
-
ページ番号
-
テキストボックス位置(本文エリア)
-
余白ガイド
を配置して、全部のページで統一。
-
3-2. 画像配置とフィッティング
-
ファイル → 配置(Ctrl/Cmd + D)
-
画像を選んでクリック配置。
-
背景が端まである画像は、フレームを塗り足し3mmの外まで伸ばす。
-
画像を選択 → オブジェクト → フィッティング → フレームに合わせて内容を調整(= Fill Frame Proportionally)。
-
文字は段落スタイルを作って(例:本文 16pt/行送り 20pt、見出し 24pt/行送り 28pt)、全ページで同じに。
3-3. 色とフォントの注意
-
小さい子に読みやすく:大きめ文字+行間やや広め。
-
背景と文字のコントラストを確保(淡い背景なら文字は濃く)。
-
フォントは埋め込み可能なもの(商用OKを確認)。
3-4. PDF書き出し(印刷)
-
ファイル → 書き出し → Adobe PDF(印刷)
-
プリセット:迷ったら 高品質印刷(印刷所の指定があればそれに合わせる)。
-
トンボと裁ち落とし
-
裁ち落とし:
上下左右 3 mmを入力 -
「ドキュメントの裁ち落とし設定を使用」にチェックでも可
-
トンボ(トリムマーク)は印刷所に指示がある時のみON
-
-
圧縮:写真が多い場合でも極端に下げない(画質優先)。
-
カラー:RGBのままで受けてくれる印刷所も多い。CMYK指定なら変換プロファイルは印刷所に確認。
3-5. 最終チェック
-
PDFを100%表示で:
-
端に白フチが出ていない(→塗り足し3mm OK?)
-
文字がくっきり、行間が読みやすい
-
ページをパラパラ見て顔・服・色・文字位置が統一
-
必要なら ファイル → パッケージ でリンク画像・フォントも同梱して入稿。
4) “同じキャラ”を保つ運用まとめ(短縮版)
-
固定テンプレ(プロンプト/ネガティブ/サンプラー/Steps/CFG/Seed/解像度)を作り、毎回コピペ
-
**img2img(denoise 0.45)**を基本運用、構図変更時だけ ControlNet 0.7
-
**Reference(顔アップ 0.8)**で顔をロック
-
それでもズレたら Inpaint でその部位だけ修正
-
色は色コードで指定(毎回同じ言い回し)
-
必要に応じて OpenPose でポーズ固定
-
本格安定を目指すなら、style LoRA(絵柄)+character LoRA(キャラ)を分けてW適用
5) すぐ使えるコピペ集
プロンプト(例)
ネガティブ
img2img 推奨値
-
denoise:
0.45(0.35〜0.55で調整) -
他はテンプレと同じ
ControlNet 推奨値
-
モード:
scribble(→合わなければlineart) -
Weight:
0.7
Reference(顔)
-
参照画像:顔アップ(明るくクッキリ)
-
Weight:
0.8
移民受け入れには賛成の立場です
移民受け入れには賛成の立場です。というか歴史から学べば、必ずこの結論に行き着くのではないでしょうか?
「移民は治安を悪化させる」との懸念もありますが、適切な審査制度を整えればならず者を防ぎ、職歴や文化適応力を備えた人材のみを迎え入れることは可能だと思います。むしろ優秀な人材を拒むことこそ、日本経済を停滞させる要因だと思います。
また「日本は単一民族国家」という考えは幻想に近く、実際には歴史的に多様な文化が混ざり合ってきました。
閉鎖的な姿勢が社会の硬直化を招いている今こそ、多様性を受け入れる柔軟さが必要です。例えば、アフリカ系やインド系の日本人が増え、文化が交じり合うことは、新たな活力と創造性をもたらすはずです。
日本文化を尊重し共生できる移民であれば受け入れるべきです。
AIと人間が決定的に違うところ
AIと人間が決定的に違うところは何かと考えると、やはり人間には個性があり、AIには個性がないというところに尽きると思う。
AIは全て100点である。いや、究極的に全て100点であることを求められるのがAIだ。だから、AIは必然的に個性がない。
ところが人間はと言えば、どの人間においても得手不得手がある。全てが100点の人間なんているわけがない。故に人間は個性的なのであり、唯一無二の存在であると言えるのだと思う。
更に言えば人間はその得手不得手の部分が互いに密接に関わっている存在であり、実際にはそれらを切り離して考えることができない。故に、一見、不完全な存在であるよう見えながら、実は既に完成された存在であるとも言える。この点において、AIがこれを真似することはできない。
例えば、たんぽぽを例に説明してみる。たんぽぽは薔薇のような美しさはないし、ヒマワリのように大きくはない。一見、100点の存在ではないように見える。しかし、よくよく考えてみたらどうだろう。たんぽぽはたんぽぽで美しく、完成された存在であること気付かないだろうか。仮に、たんぽぽに薔薇の花びらをつけてみよう。ヒマワリの茎をつけてみよう。より美しくなるだろうか?それはバランスを欠き、滑稽であり、雑多でしかない。
人間は個性的であるからこそ、つまり、不完全であるからこそ、愛すべき存在なのだ。もし、この先、死ぬまでAIと人、どちらか一方とだけしか暮らすことができないと二択を迫られたら、あなたはどちらを選ぶでしょうか?答えははっきりしていますよね。
AIが今後、人間の能力を遥かに超えた存在となっても人間の価値は決して失われない。寧ろ、人間、ひとりひとりが持つ個性こそがAI時代に最も大きく注目されることになるのだと思う。

