発表によると、OmniHumanはテキスト、音声、体の動きなど複数の入力を組み合わせたアプローチと、1万8700時間を超える人物の動画データでトレーニングされているとのこと。