前言
需要借助的项目:
这个项目其实有一个官方的 Web 网站可以翻译:
https://academic.chatwithpaper.org/
然而,这种 Web 界面有一个缺点,那就是只能一篇一篇的翻译。
假如我在睡觉之前想要调研某个方向,并且找好了十余篇论文(甚至几十篇)想要在第二天早上一睹为快,希望能在睡觉的时候统统翻译好,那么该怎么办呢?
如果你的需求和我上面说的一样,就可以接着往下看了
正文
Clone 下来这个项目,然后直接用带 latex 的 Docker 启动起来,docker-compose.yaml
里面的 image
选这个: ghcr.io/binary-husky/gpt_academic_with_latex:master
,然后记得把 DEFAULT_WORKER_NUM
的值也改大一点,加快翻译速度
我们使用 Docker 的原因是因为你自己电脑上配 latex 环境可能会在编译的时候缺各种包报错,为了省事便捷建议直接用 Docker
然后使用 VSCode 连接到这个 Docker 里面:
https://cn.linux-console.net/?p=7645
进入 /gpt/tests
目录,创建 translate_arxiv.py
文件,内容写成这样:
import init_test
import os, sys
if __name__ == "__main__":
from test_utils import plugin_test
# 这里是你想翻译的 arxiv 论文的 id 列表
arxiv_list = ["1706.06978", "1809.03672", "1905.09248", "2006.05639", "2101.11427"]
for each in arxiv_list:
plugin_test(plugin='crazy_functions.Latex_Function->Latex翻译中文并重新编译PDF', main_input=each)
使用 bash -c "python3 -u translate_arxiv.py"
运行,即可在容器里面一键跑起来翻译。最后在 /gpt/gpt_log/arxiv_cache
目录下找到翻译好的内容即可
使用 VSCode-PDF 插件可以直接在 VSCode 里面读翻译好的论文,不需要下载。
备注
撰写本文时,项目版本文件 version
内容如下:
{
"version": 3.90,
"show_feature": true,
"new_feature": "增加RAG组件 <-> 升级多合一主提交键"
}
如果随着后续更新本文内容不适用,可以选择按照该思路重新适配,或者直接回退到该版本。
END