プロ漫画家監修の縦読みマンガ特化生成AIモデル「HANASEE-image-1.0」公開|キャラの外見・画風の一貫性を保ちながら様々な構図に対応

画像生成AIは、いま「汎用」から「専用」へと向かっています。テキストから何でも描けるモデルが普及する一方で、特定の表現・用途に深く最適化された専門モデルへの需要が高まりつつあります。縦読みマンガ(ウェブトゥーン)市場がグローバルに拡大するなか、日本発のプロジェクトが、この専門特化の流れをマンガ創作の領域で体現しようとしています。


2026年4月24日、extra mile株式会社が展開するIPプロジェクト「Xross Road」による、縦読みマンガのコマ画像生成に特化した自社開発の画像生成モデル「HANASEE-image-1.0」を公開した。

オープンソースの画像生成モデルをベースに、プロ漫画家の監修・協力のもと独自の改良と追加学習を施したモデルで、
①キャラクターの一貫性(髪型・顔立ち・服装をコマをまたいで維持する最適化)
②画風の一貫性(「さわやか」「パワフル」「クール」など6種の最適化済み画風)
③縦読みマンガに適した構図の自動生成
という3点を特徴とする。

本モデルは、同社が4月30日より提供を開始するマンガ創作プラットフォーム「HANASEE」のクローズドβ版にて利用可能となる。クローズドβへの参加申請受付は2026年4月27日までで、抽選での案内となる。

From: 文献リンクXross Road、自社画像生成モデル「HANASEE-image-1.0」を公開(PR TIMES)

【編集部解説】

「絵を描く」で終わらない——ウェブトゥーン形式への深い最適化

HANASEE-image-1.0のユニークさは、「マンガ風の絵を生成する」モデルではなく、マンガという形式そのものに最適化している点にあります。

縦読みマンガ(ウェブトゥーン)は、スマートフォンでのスクロールを前提とした、紙のマンガとは別物の形式です。コマは上から下へ流れ、縦長のワイドなコマで感情の「間」を作り、横長の狭いコマでテンポを刻み、突然の大ゴマで読者の指を止めるといった、スクロール時間そのものを使った表現文法があります。グローバル市場も急拡大しており、調査会社Mordor Intelligenceによると2025年時点で約108.5億ドル、2031年には約602.5億ドルへ、年平均33.1%で成長する見込みです。日本の電子書籍市場も2024年度に6,703億円、2029年度には8,000億円弱に達する見込みで、成長を牽引するのがウェブトゥーンを含む縦読み形式です。

HANASEE-image-1.0は、この縦読みマンガ特有の課題に正面から向き合っています。プレスリリースに挙げられた3つの特徴は、それぞれが業界的な難題への回答です。

①キャラクターの一貫性は、画像生成AIが長年抱えてきた最大の壁です。同じキャラクターを複数コマにわたって描くと、髪型や服装、顔立ちがコマごとに微妙にずれるなどの課題が従来の汎用モデルでは解決困難で、AIマンガの商業化を阻んできました。2025年以降、Identity Embedding(アイデンティティ埋め込み)やLoRA微調整、参照シートといった技術が成熟してこの壁は崩れ始めており、HANASEE-image-1.0もこの系譜の独自実装と位置づけられます。

②画風の一貫性は、連載漫画における「作家性」の核心部分です。プロの漫画家の作品が読者に愛されるのは、ストーリーだけでなく、線の太さや陰影、表情の崩し方といった画風の同一性があるからです。「さわやか」「パワフル」「クール」など6種類のプリセット画風を用意し、将来的にはミックス可能にする設計は、アマチュアクリエイターに「作家性」を補助輪として提供する試みと言えます。

③縦読みマンガに適した構図は、特に重要です。単に絵を描けても、そのままではウェブトゥーンになりません。指定されたコマサイズや画角に応じて構図を柔軟に生成し、さらに創作ワークフロー側がストーリー展開からコマサイズを判断し、モデルに指示していきます。まさに「コマ割り」と「作画」が分業ではなく連携しているという設計です。これは、AIが単に画像を吐き出す道具ではなく、マンガ制作という総合的な創作工程のなかに組み込まれることを意味します。


「プロ漫画家の監修・協力」が意味するもの

もうひとつ注目すべきは、HANASEE-image-1.0がプロの漫画家の監修・協力のもとに開発された点です。

海外で先行するAI漫画ツールの多くも、オープンソースの基盤モデルにLoRA微調整やキャラクター一貫性のためのリファレンスシート等を組み合わせる方式を採っています。ただし、プロ漫画家による開発段階での監修・協力を公式の特色として明確に打ち出している例は、現時点では多くありません。これに対してHANASEE-image-1.0は、プロの制作現場の手法をモデル学習に組み込もうとしています。

プロの漫画家の仕事には、画力だけでなく、明示化しにくい暗黙知が多く含まれます。視線誘導を意識したコマ内の構図、キャラクターの「見え方」を決める角度、感情を伝える表情の崩し方、画風のなかの「一貫した揺らぎ」など、こうした要素は、技法書を読んでも身につかず、編集者との長年のやりとりを通じて獲得される職人の感覚です。これをオープンソースの画像生成モデルに「追加学習」という形で取り込んでいるとすれば、モデルそのものがプロの編集現場の暗黙知を部分的に内包した状態になることを意味します。

これは技術的アプローチとして興味深いと同時に、倫理的にも重要な問題を含んでいます。AIが絵を描くとき、その学習元となったクリエイターとの関係はどうなるのか。この問いは、海外のAI画像生成をめぐる訴訟や、日本のクリエイター団体の懸念の中心にあるテーマです。同社は2026年内に、透明性の高いレベニューシェアを保証する権利管理システムの導入を予定しています。監修・協力した漫画家との契約関係や、生成物の権利帰属の整理が実際にどこまで徹底されるかが、今後HANASEEが説明責任を果たすべき領域になるでしょう。


「誰が描いたのか」という問いは避けて通れない

プロ監修による特化型モデルというHANASEE-image-1.0の特徴は、AIが創作に深く関与するツール全般に通底する問いとも結びついています。作品のどこまでを人間が担い、どこからがAIなのか、という境界の問題です。

HANASEEの基本的な流れは、ユーザーが原作を選択し、AIがコマ割り・プロット・キャラクターデザイン・画像・画風までを生成し、ユーザーは各要素の編集と選択を行う、というものです。一筆も描かずにAIが生成した素材を組み合わせることで一本のマンガが成立するという使い方も理論上可能な設計です。ここには、アイデアの提供者を著作者と呼べるのか、そしてユーザーが「AIにアイデアを与えている」つもりが、実はAIが提示した選択肢から選んでいるだけになっていないか、という問いが生じます。

関連して、作品が没個性に陥らないための設計も見逃せない論点です。画風は現時点で6種類のプリセットから選択する方式で、今後は「画風をミックスして作風に独自性を持たせる機能」も予定されています。ミックス機能に言及があること自体、プラットフォーム側が差別化の必要性を自覚していると読むこともできます。

こうした問いに決着をつけるのは、HANASEEだけの課題ではありません。ただ、プロ監修の特化型モデルという明確な強みを持つサービスだからこそ、著作者性と作家性をめぐる設計は、読者とクリエイターが注視すべきポイントになるでしょう。

【用語解説】

ウェブトゥーン(Webtoon/縦読みマンガ)
スマートフォンでの縦スクロールを前提に制作されたデジタルマンガ形式。コマが縦一列に配置され、紙のマンガとは異なる独自の表現文法を持つ。韓国Naverが2000年代に展開した「Webtoon」プラットフォームが名称の起源で、現在は形式の総称として定着。K-コンテンツの波に乗り、日本・北米・東南アジアへと市場が急拡大中。

オープンソース画像生成モデル
コードおよびモデルの重み(学習済みパラメータ)を公開した画像生成AI基盤。誰でも無料で利用・改修・再配布が可能。代表例はStability AIが開発したStable Diffusion系列。商業サービスから個人開発まで幅広い用途で採用され、HANASEE-image-1.0のように特定用途に最適化するための出発点(ベースモデル)となっている。

追加学習(ファインチューニング)
汎用AIモデルを特定の用途・スタイル・ドメインに適応させるための再トレーニング手法。元のモデルが持つ汎用的な能力を保ちつつ、新しいデータや指示を組み込んで専門性を高める。スクラッチから学習するより大幅に少ないデータ・計算コストで済む点が特徴。画像生成AIの文脈では、特定の画風やキャラクターへの適応に広く用いられる。

LoRA(Low-Rank Adaptation)
既存の画像生成モデルを少量の学習データで効率よく特化させる軽量な追加学習技術。モデル全体のパラメータを書き換えるのではなく、低次元の行列(低ランク行列)を追加することで計算コストを大幅に抑えながら高い適応精度を実現。AI漫画・イラスト生成の文脈で、キャラクターの外見一貫性を実現するために広く用いられている。

アイデンティティ埋め込み(Identity Embedding)
特定のキャラクターや人物の視覚的特徴(顔の構造、体型、服装など)を数値的な「指紋」としてAIモデルに記憶させる技術。一度埋め込まれた特徴は、異なるシーンや構図の画像を生成する際にも参照され、複数コマにわたるキャラクターの同一性を担保する。LoRAと組み合わせて使われることが多い。

IPコンテンツ / IP(Intellectual Property)
知的財産権に基づくコンテンツの総称。小説・マンガ・アニメ・ゲームなど、固有のキャラクター・世界観・物語を持つ著作物とその派生物を指す。Xross Roadが掲げる「IPコンテンツ創出・ディストリビューション」は、未発掘のオリジナルIPを発掘し、マンガ化・アニメ化・グローバル配信へと連鎖的に展開するエコシステム構築のコンセプト。

【参考リンク】

HANASEE 公式LP(事前登録)(外部)
縦読みマンガ創作プラットフォーム「HANASEE」の公式LP。正式リリースに向けた事前登録を受付中。

HANASEE クローズドβ版 利用申請フォーム(外部)
4月27日締め切りの申請受付から抽選でクローズドβ版の利用案内。4月30日提供開始予定。

Xross Road 公式サイト(外部)
extra mile株式会社が展開するIPコンテンツ創出・流通プロジェクトの公式サイト。AIとブロックチェーンを組み合わせたIPエコシステムの概要・チームを掲載。

extra mile株式会社(外部)
HANASEE・Xross Roadの開発・運営母体。テレビ朝日ミュージックの100%子会社として、Web3領域のIPコンテンツ事業を展開。

【参考記事】

Webtoon Market Report — Mordor Intelligence(外部)
グローバルウェブトゥーン市場の規模・成長率・企業シェアを分析した市場調査レポート。記事中の市場規模数値の一次情報源。

電子書籍ビジネス調査報告書2025 — インプレス総合研究所(外部)
日本国内の電子書籍市場規模を毎年公表する専門調査。2024年度6,703億円と2029年度成長予測を掲載。

AIと著作権に関するチェックリスト&ガイダンス — 文化庁(2024年7月)(外部)
生成AIと著作権に関する日本の公式指針。AI生成物の権利帰属を考えるうえで押さえておきたい文書。

小説からマンガを生成するextra mile、プレシードで150万米ドルを調達 — BRIDGE(2026年2月)(外部)
日本語技術メディアBRIDGEによる報道。IPエコシステム構想と権利管理システムの導入計画を日本語で整理。

Webtoon Market Size, Trends, Share, Growth Report — Mordor Intelligence(外部)
グローバルウェブトゥーン市場の詳細分析。記事中の市場規模数値(108.5億ドル→602.5億ドル、CAGR 33.1%)の一次情報源。

2024年度の国内電子書籍市場規模は6703億円 — インプレス総合研究所(2025年7月)(外部)
2024年度6,703億円と2029年度8,000億円弱への成長予測を含む国内電子書籍市場の専門調査。

2025 AI Image Generation Trends: The Next Frontier — Tripleareview(外部)
2025年の画像生成AI専用化トレンドを解説。製品撮影・医療画像・漫画生成と領域別専門モデルの広がりを整理。

AI Manga Character Generator — Jenova.ai(外部)
AI漫画のキャラクター一貫性を実現する技術手法(Identity Embedding・LoRA・参照シート)を解説した英語記事。

【関連記事】

【編集部後記】

AIに手助けしてもらっているつもりが、いつの間にかAIが提示した選択肢の中から選んでいるだけだった。そんな経験はありませんか?これは果たして、「人間の意思」と言えるのでしょうか。

強力なツールが出るほど、敷居は下がり、様々な理由で埋もれていた才能が発掘されることもあると同時に、競争も激しくなります。やっと土俵に立てたと思っていたら、そこはすでに土俵ではなくなっている可能性もあるのです。

多少の才能はAIに飲み込まれていく中、人の価値はどういうところに残るのでしょうか。

投稿者アバター
りょうとく
趣味でデジタルイラスト、Live2Dモデル、3Dモデル、動画編集などの経験があります。最近は文章生成AIからインスピレーションを得るために毎日のようにネタを投げかけたり、画像生成AIをお絵描きに都合よく利用できないかを模索中。AIがどれだけ人の生活を豊かにするかに期待しながら、その未来のために人が守らなけらばならない法律や倫理、AI時代の創作の在り方に注目しています。