しゃべる画像

こんにちは!サキナオコです!^o^

なぜ寒い?

 

SadTalkerでの違いを検証!

crop

A

B

C

C

ってう~んまあよくわからないけども。

 

まずcropとは半身写ってても顔だけになる。

 

AとCが揺れが大きい。

w/ Still Mode (fewer hand motion, works with preprocess full)
w/ スチルモード(手の動きが少なく、プリプロセスフルで動作します。)

 

って書いてあるけどなあ。fullじゃなくてcropでも動作するのかな。

 

w/ GFPGAN as Face enhancer

顔面強化剤(!!)としてGFPGANを使用

にチェックを入れた、

C,Dは画像が荒いのと細かいの、それぞれ両方動画ができてた。

 

見た感じでは下の項目どちらもチェック入れずに生成したAがいい感じ。

 

resize 顔が崩れた。怖いので次にいく

full

A

B

C

D

なるほどねえ。

 

体が動かないので顔が動きすぎては画像に切れ目が見えて不自然です。

動かなすぎて動作的には不自然ですが、画像的には自然です。

なお、顔面強化剤(って…)が効いて、C,Dはきれいです。

 

体が入ってくるとやはり、A、Cのような動きすぎはよくなくて、
B,Dで顔が動きすぎない方が画像が自然。

顔面強化するならチェック両方ですね。

 

A,B,C,Dの各フォルダには顔バージョンだけのも保存されてました。
これは何か設定があるのかしら。

結果、

cropで

顔だけ画像荒くていいならチェックなし。顔面強化できれいな画像にするには

w/ GFPGAN as Face enhancerチェック

 

fullで

体も入れる場合、荒くていいなら

w/ Still Mode (fewer hand motion, works with preprocess full)

顔面強化なら

w/ GFPGAN as Face enhancerチェック

 

ということですね。

 

そして、よく使うと思われる胸から上の画像でやってみますよ。

resizeもいい感じに効いてます。

顔面強化は割愛させていただきます。

 

A

B

C

crop

チェックなし

resize

チェックなし

full

チェックなし

普通に見える

胸から上だとresizeがいい感じに効くらしい

最後あたりに首の付け根に切れ目が出、あらぬ方を向く

A

B

C

crop

w/ Still Mode (fewer hand motion, works with preprocess full)

resize

w/ Still Mode (fewer hand motion, works with preprocess full)

full

w/ Still Mode (fewer hand motion, works with preprocess full)

やっぱり固定されてる感が不自然か。ありといえばあり

固定されてるなりに自然な感じがする

微動だにせず話す人みたいでちょい不自然

 結果

胸上画像を使うならresizeでチェックなしまたはw/ Still Mode (fewer hand motion, works with preprocess full)がいい感じ。

顔のみならcropチェックなしで。

 

ずっとこのおねえさんの動く画像見てたら、声が自分なので、画像も自分なんじゃないかという気がしてきました(違う)。

以上です!


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA