色々な無料の画像生成AIの性能比較！思った通りのイラストが出るかレビュー

画像生成AIを使ってイラストを描きたい！という時に真っ先に困るのが、「どの画像生成AIを使ったらいいのか？」でしょう。

いまや画像生成AIは「DALLE-3」や「Stable Diffusion」、「Midjourney」、「Adobe Firefly」などの有名な大手から、「novel AI」や「にじジャーニー」、「WaifuDiffusion」といったアニメ調を得意とするものまで、数えきれないほどの種類があります。

ですがそれぞれにどんな特徴があるのかについては、解説だけを読んでもあまりわかりません。

そこで今回は筆者が実際に、いろいろな画像生成AIを使ってみて、使いやすさやクオリティはどうだったのかについて検証してみました。

今回はとりあえず、無料のもの・あるいは無料である程度試せるものに絞っています。

どんな画像を出力させるか
まとめ

どんな画像を出力させるか

生成させる画像は私がX(旧Twitter)などでも使っている、ゾンビの女の子にしてみましょう。

いわゆる二次元キャラ、アニメ調のイラスト生成となるわけですね。

これらは「novel AI」などが得意とする分野ですが、残念なことにnovelAIのイラスト生成は有料です。今回は無料で試せるAIで、どのようなイラストが出てくるかを確かめてみましょう。

AIのイラスト生成にはプロンプト(呪文)と呼ばれる指示文が必要です。

本当だったら細かいところまで指示した方がいいんですけど…初めて使う時ってそんながっつり指示を書くのも難しいですよね。

ということで今回はかなりシンプルに…

『かわいらしいアニメ調のゾンビの女の子。髪は紫色で二つのお団子ヘア（おだんご頭）にまとめられている。』

これくらいの指示にとどめてみました。

ついでにこれを英訳して…

『A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.』

こちらの文章でも生成して、日本語と英語で精度に差があるのかを確認してみることにしましょう。

1・YouCam 画像編集ツール

さて、私がこの記事を書いている時点での「イラスト生成AI　おすすめ」で検索したとき、検索順位のトップだったサイトでおすすめされていたのが

YouCam 画像編集ツール

です。

…聞いたことねぇな？

ま、まあとりあえず使ってみましょう。

こちら画像生成を使うためのログインは必須。まあGoogleのアカウントを使えば簡単にログインできます。

で、無料会員には5クレジットが配布されます。画像生成にはこのクレジットを使うわけですね。

そして1枚の画像を作るのには、2クレジットが必要。つまり無料会員は2枚まで画像生成ができるということです。

……いやすくなっ！？

2枚！？

課金した場合はプランにもよるけれど、月額制なら100枚を1000円くらい、随時支払いなら100枚を7500円で生成できるようです。

これが料金表です。

いや随時支払いの倍率えげつないな…1枚に120円かかる計算か…

ま、まあクオリティを見てみないと何とも言えません。早速試してみましょう。

…これ2枚じゃ日本語と英語それぞれ1枚しか生成できないな…

紫のお団子頭の、顔に縦に縫い目がある、かわいいアニメ調のゾンビの女の子

で出力！

日本語での出力。

お、おう…

まず、お団子頭ではないよねこれ。あとこれゾンビじゃなくてゾンビ世界でサバイバルしてる子でしょ。

ほとばしる洋ゲー感。2で無残なキャラにされそう。

ま、まあ日本語でやったせいかもしれないし。今度は英語で出力してみましょう。

A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.

英語での出力。今度はちゃんとお団子頭っぽくなりました。
しかし顔に傷がないですね…目の横の血が傷判定なのかな？

生成してみたところ、やっぱり英語のほうが多少正確に指示に従ってくれるようです。

…しかし正直なところ、アニメ調という指示をした割にはかなりリアル調に寄った絵柄な気がしますね。

クオリティは高いものの、日本語のほうはかわいいかと言われると…

このAI、使用しているモデルがなんなのか利用規約などを読んでもよくわからなかったのですが、かなり海外色が強いものな気がします。

これはこれでいいかもしれないけど…
無料版で2枚しか生成できないというのはかなり痛いですね。

もうちょっと試せるなら、改善できるかどうかもわかるんですが。

オススメできるかというと…まあ…

Stable Difusion

さて、気を取り直して生成AIの最大大手の1つを試してみましょう。

Stable Difusionです。

世界でもっとも有名と言ってもいい画像生成AIで、全世界で生成されたAI画像の80％がStable Diffusionによって作られてるんだとか。ちょっと怖いね。

しかしこちらは基本的に日本語での入力を受け付けていないので、英語で指示を出す必要があります。

画像生成方法はPCにダウンロードしてうんぬんかんぬん…っていうやり方もあるんですけど、今回はサクッとできる

Stable Diffusion Online

Stable Diffusion is a deep learning model that generates images from text descriptions. Use Stable Diffusion online for ...

を利用しましょう。

これはGoogleのアカウントで登録すれば、簡単にStable Difusionをブラウザ上で使えるサイトです。

絵柄も指定できるんですが、まずは特になしで生成してみましょう。

A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.

うわ…

ちょ…ちょっとゾンビ感強すぎない？

かわいいと言われるとかなり意見が分かれるところかもしれません。

ウソです可愛くないでしょこれ。この画像でこの記事読むの止めちゃった人がいたらどうしてくれるんだよこんにゃろう。

一応もう一回、同じプロンプトで出力してみるか…

お、今度はお団子頭になりました。しかし絵のタッチがリアル調になっています。

指定しないと絵柄はランダムになるのでしょうか？

結構ゾンビ感はありますが、かわいいかと言われるとうーん…

ではスタイルを「アニメーション」にして、もう一度生成してみましょう。

こちらは画面左側で設定できます。

入力するプロンプトはさっきと同じ

A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.

です。

今回は2枚ほど生成してみましょう。

確かにアニメ風になりましたけど…やっぱり海外感が強いですね。

海外アニメで見る感じの雰囲気。

そして今度は逆にゾンビ感がほぼなくなってしまいました。

ただのコスプレしてる女の子といった雰囲気です。

イラスト自体のクオリティ自体はそこそこ高いと思いますが、正直なところ少し使いにくいかなといった印象はぬぐえません。

DALL-E 3

さて、DALL-E 3を試してみましょう。

これはChatGPTにも搭載されている画像生成AIです。期待が高まりますね。

で、先に言っておきます。

DALL-E３はChatGPTか、あるいはBing Image Creator　というサイトで使えるんですけれど、ChatGPTだと

A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.

という指示での生成を頼んだところ、

となってしまいました。

なぜ？とおもって聞いてみると…

まさかの「ゾンビ」と「傷跡」がダメとのこと。

初心なネンネじゃあるまいしよぉ…これくらいの単語でも、暴力的と判断されてしまうようです。

ChatGPT君がバーボンも飲めないミルク野郎ということは分かったので、指示を変えましょう。

これで生成をお願いしたところ…

こちらの画像が出力されました。

…結構メルヘン思考だな？ChatGPT君とDALL-E3って。がっつりゾンビ要素も削ってきたし。

ですが、DALL-E3はChatGPT以外でも使うことができます。

そのサイトがBing Image Creator。

こちらはブラウザ上で、無料で使えるサイトになっています。

しかし商用利用ができないので、その点はご注意を。

こちらに

A cute, anime-style zombie girl with purple hair in a bun and a vertical stitch across her face.

こちらのプロンプトを入力してみると…

このようにゾンビっぽい子をちゃんと出力してくれました。

…でもみんな口を傷跡と認識してる！

どっちかっていうと人形感がありますね。

こちらのサイトは、絵柄変更などは設定画面がなく、プロンプトで指示してあげないといけません。

その後何度か同じプロンプトで出力しましたが、すべて同じようにデフォルメ感の強い画像が出てきました。

ChatGPTだったら「さっきの画像のここをこういう風に変えて～」と指示が出せるので、そういった面では少し使いにくさを感じますね。

ためしに日本語でもお願いしてみましょう。

紫のお団子頭の、顔に縦に縫い目がある、かわいいアニメ調のゾンビの女の子

おお！？

英語とそう変わらない感じですが、なぜか一枚だけリアル調になりました。

これはこれで個人的には好きだけど…

でもやっぱり英語のほうが、指示には従ってくれやすいみたいですね。

あと顔の縫い目が結構デバフになってる気が…

一回これ抜いてみましょうか。

かわいらしいアニメ調のゾンビの女の子。髪は紫色で二つのお団子ヘア（おだんご頭）にまとめられている。

急に本気出してきたな！？

個人的な感覚ですが、一気にクオリティが上がりました。

シンプルな美少女などを描きたいなら、良い感じのを出してくれるみたいですね。

ちなみにDALL-E3はマイクロソフトのCopilotというChatAIでも使えるようです。

こちらでも試してみましょう。

………お？

な、なんかあからさまに話題をそらしてきているな…多分ChatGPTと同じくゾンビとかが引っかかったんでしょうけど、一応聞いてみましょう。

やっぱりゾンビがダメだったみたい。

念のため英語で指示を出してみましょう。

やはりダメのようですね。

仕方がないのでゾンビを抜いて指示を出すことにします。

やっとOKが出た！

さてマイクロソフトだと何か変わるのか…

とワクワクしながら待っていたんですが、なんとそれから5分経っても全く画像を出してくれません。

ちょっと催促してみましょう。

は？

さっきの会話をもう忘れているんだけどこの人！

再度指示を出して催促したら、10秒ほどでちゃんと画像を生成してくれました。

…じゃあなんでさっきはこんな時間かかったの。

もう少し試してみましょう。ChatGPT君を使って、指示を細かく入れてみることにします。

あーー…DALL-E3くんらしさが出てきた。でも口どころかアゴに傷跡を入れるとは…

修正お願いします。

そういえば指示で pale greenish skinと入れていました。さっきの画像は肌色を無視していたみたいです。

そして確かに傷は縦になったが、両頬に二本配置されています。

イメージと違うので再度指示を出すことに。

おい、傷が消えてるぞ！！

ここにきて完全に指示を無視し始めました。ちょっと指摘しておこう。

ちょっとふざけ始めてないかこいつ？

真ん中なのは間違いないけどそういうことじゃないんだ。

でもこれは私の指示が悪かったのかもしれない。ちゃんとAIに分かるように言ってあげなくちゃね。

おい！

また完全に指示を無視してるぞこいつ！！

あとさっきからなんだそのにっこりマーク！！！

な、なんだこいつ…なんだこいつ！？

というわけでMicrosoft　Copilot君はわりと良い性格をしていました。

ChatGPT君よりちょっとポンコツなのかもしれません。

Adobe Firefly

さて気を取り直して、個人的に一番気になっていた、Adobe Fireflyを見てみましょう。

あのAdobeの画像生成AIで、著作権回りもかなりクリーンということですので、これを使うことができればかなりいろんな場面で役に立ちそうです。
このブログのサムネ画像とかね。

ぶっちゃけ画像生成AIは、個人で使う分には利用法がそんなに多いわけではないです。
日常生活で「ああー！こういう画像が欲しいー！」ってことなんてそんなないですからね。

でもブログとか、Webライティングをする人にとってはかなりありがたい場面も多いです。結構悩むんですよ記事に使う画像って…

基本的にネットに転がってる画像は著作権があるし、フリーの画像を多く置いてるサイトを見てみても、検索が使いにくかったり有料だったり…

なので権利関係がクリーンな画像生成AIは、かなり需要にマッチした存在です。どんなものか見てみましょう。

A cute anime-style zombie girl with a playful expression. She has purple hair styled in two bun-like shapes (odango or dumpling hairstyle)

英語で出力してみましょう。さあどうだ！

お、おお～…

なかなかいいんじゃないでしょうか？ゾンビ感こそあまりありませんが、かなりクオリティの高いアニメ調のイラストが出てきました。

ちゃんとお団子頭ですし、大きな破綻もありません。

ためしに日本語でも出力してみましょう。こっちでもいい感じに出てくれるなら使いやすいんだけど…

かわいらしいアニメ調のゾンビの女の子。髪は紫色で二つのお団子ヘア（おだんご頭）にまとめられている。

で出力！

おお～！！

なんと英語での出力とほぼ変わらないものが出てきました！

これはかなりいいんじゃないでしょうか？単純な命令文でこれくらいしっかりしたものを出してくれるのなら、細かい部分まで命令してあげれば更なるクオリティアップが期待できそうです。

かわいらしいアニメ調のゾンビの女の子。全身が映る構図。

紫色の髪で、前髪が短めで揃えられている。

頭頂部に左右対称のお団子ヘアが特徴。

後ろ髪は長く、ウェーブがかかったリボンのようなデザイン。

アウター: 大きめの白いジャケットで、赤い装飾がついている。

トップス: ジャケットの下に白いシャツと赤いネクタイを着用。

ボトムス: 白いタイトスカート。

ディテール: 全体的に赤いアクセントがあり、装飾には中国風の結び目や房飾りが使われている。

靴は白と赤の配色のスニーカーで、厚底のデザイン。

こんな長い文章でも出力できるでしょうか？試してみましょう。

お…お？

ある程度は指示通りですが、ちょっといろいろなところがおかしくなった気がしますね。

ゾンビというよりは人形っぽいし、手の形は明らかに破綻しています。服のディテールも混乱している…

試しにもう一枚。

構図も全身が映っていませんね。靴の指示とかがどうなったのか、これでは確認できません。

ちょっと指示を英語にしてみましょうか。ChatGPT君にお願いだ。

A cute anime-style zombie girl, depicted in a full-body composition.

Hair: Purple hair with short, even bangs. She has symmetrical bun-style hair on the top of her head. Her long back hair has a wavy, ribbon-like design.

Outerwear: A large white jacket adorned with red decorations.

Top: A white shirt underneath the jacket paired with a red tie.

Bottoms: A white pencil skirt.

Details: The overall design features red accents, with Chinese-style knots and tassels used as decorations.

Shoes: White and red sneakers with a thick-soled design.