相关工具介绍
Jina AI
Jina AI 开源了 RAG 数据处理中的关键组件:“网页数据爬取” – Reader
- 在
https://r.jina.ai/<url>中填入任何 Url 即可获取到 LLM 友好的 Parsed Content( Markdown) - 免费使用,提供 Stream 模式可流式读内容(简单内容 <=2s 可获取)
可以访问 Reader API ,尝试在线 Demo
Markdown Translator
直接丢给GPT翻译就行了
或者用:
这个项目,项目实现了对数据切分并行翻译的功能,你也可以使用其他任何 Markdown 翻译工具
使用方法
- 找到你要翻译的英文网页
https://abc.com - 访问
https://r.jina.ai/https://abc.com,过一段时间网页就会显示Markdown - 把markdown丢给GPT翻译成中文即可
非常推荐BBS里面的英文帖子都翻译成中文,便于阅读学习 ![]()
END