Skip to content

Latest commit

 

History

History
65 lines (47 loc) · 1.54 KB

faq.md

File metadata and controls

65 lines (47 loc) · 1.54 KB
  1. pytorch3d安装不成功
    下载源码编译
git clone https://github.com/facebookresearch/pytorch3d.git
python setup.py install
  1. websocket连接报错
    修改python/site-packages/flask_sockets.py
self.url_map.add(Rule(rule, endpoint=f)) 改成 
self.url_map.add(Rule(rule, endpoint=f, websocket=True))
  1. protobuf版本过高
pip uninstall protobuf
pip install protobuf==3.20.1
  1. 数字人不眨眼
    训练模型时添加如下步骤

Obtain AU45 for eyes blinking.
Run FeatureExtraction in OpenFace, rename and move the output CSV file to data/<ID>/au.csv.

将au.csv拷到本项目的data目录下

  1. 数字人添加背景图片
python app.py --bg_img bc.jpg
  1. 用自己训练的模型报错维度不匹配
    训练模型时用wav2vec提取音频特征
python main.py data/ --workspace workspace/ -O --iters 100000 --asr_model cpierse/wav2vec2-large-xlsr-53-esperanto
  1. rtmp推流时ffmpeg版本不对 网上版友反馈是需要4.2.2版本。我也不确定具体哪些版本不行。原则是运行一下ffmpeg,打印的信息里需要有libx264,如果没有肯定不行
--enable-libx264
  1. 替换自己训练的模型
.
├── data
│   ├── data_kf.json对应训练数据中的transforms_train.json)
│   ├── au.csv			
│   ├── pretrained
│   └── └── ngp_kf.pth对应训练后的模型ngp_ep00xx.pth

其他参考 lipku/LiveTalking#43 (comment)