AI-digital-human/assets/faq.md at main · xixuer/AI-digital-human · GitHub

pytorch3d安装不成功
下载源码编译

git clone https://github.com/facebookresearch/pytorch3d.git
python setup.py install

websocket连接报错
修改python/site-packages/flask_sockets.py

self.url_map.add(Rule(rule, endpoint=f)) 改成 
self.url_map.add(Rule(rule, endpoint=f, websocket=True))

protobuf版本过高

pip uninstall protobuf
pip install protobuf==3.20.1

数字人不眨眼
训练模型时添加如下步骤

Obtain AU45 for eyes blinking.
Run FeatureExtraction in OpenFace, rename and move the output CSV file to data/<ID>/au.csv.

将au.csv拷到本项目的data目录下

数字人添加背景图片

python app.py --bg_img bc.jpg

用自己训练的模型报错维度不匹配
训练模型时用wav2vec提取音频特征

python main.py data/ --workspace workspace/ -O --iters 100000 --asr_model cpierse/wav2vec2-large-xlsr-53-esperanto

rtmp推流时ffmpeg版本不对网上版友反馈是需要4.2.2版本。我也不确定具体哪些版本不行。原则是运行一下ffmpeg，打印的信息里需要有libx264，如果没有肯定不行

--enable-libx264

替换自己训练的模型

.
├── data
│   ├── data_kf.json （对应训练数据中的transforms_train.json）
│   ├── au.csv			
│   ├── pretrained
│   └── └── ngp_kf.pth （对应训练后的模型ngp_ep00xx.pth）

其他参考 lipku/LiveTalking#43 (comment)