4

虎年春节,撸了一个文言文白话文转换器

 2 years ago
source link: https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ%3D%3D&%3Bmid=2650428941&%3Bidx=1&%3Bsn=e7e434e4f6ba8c93fe50918cff2007da
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

虎年春节,撸了一个文言文白话文转换器

Original 52nlp AINLP 2022-02-06 10:53
640?wx_fmt=jpeg

春节前几天,看到了东北大学小牛翻译团队开源的语料项目:文言文(古文)-现代文平行语料(https://github.com/NiuTrans/Classical-Modern) ,这个项目整理了非常全的文言文(古文)- 现代文(白话文)对齐数据,基本涵盖了大部分经典古籍著作,并且对原始爬取的篇章级对齐数据进行了断句及人工校对,形成了共计约96万句对的文言文-白话文对齐(平行)语料。

这份语料数据很珍贵,看到的第一眼想到就是用这份文言文现代文对齐语料训练一个文言文白话文转换器:文言文(古文)转白话文(现代文),白话文(现代文)转文言文(古文)。

刚好春节假期有点闲,于是训练了两个神经网络机器翻译模型:文言文(古文)到白话文(现代文),白话文(现代文)到文言文(古文),现在可以在AINLP公众号直接对话测试了,至于效果,基于语料和模型的水平,仅供一乐,大家可以自行评估。

具体使用方法:关注AINLP公众号,对话输入"文言文转白话文:待转换内容"或者"文转白:待转换内容"测试文言文转白话文,输入"白话文转文言文:待转换内容"或者"白转文:待转换内容"测试白话文转文言文:

640?wx_fmt=jpeg
0?wx_fmt=png
AINLP
一个有趣有AI的自然语言处理公众号:关注AI、NLP、机器学习、推荐系统、计算广告等相关技术。公众号可直接对话双语聊天机器人,尝试自动对联、作诗机、藏头诗生成器,调戏夸夸机器人、彩虹屁生成器,使用中英翻译,查询相似词,测试NLP相关工具包。
342篇原创内容
Official Account

以下是我的一些测试结果,感兴趣的朋友可以关注AINLP公众号直接测试:

640?wx_fmt=jpeg
640?wx_fmt=jpeg

也可以先用AINLP写一段文言文,然后再翻译成白话文,不过看起来有点怪:

640?wx_fmt=jpeg

以下是AINLP目前支持的自动生成模块,欢迎关注测试:

鼠年春节,用 GPT-2 自动写对联和对对联
用 GPT-2 自动写诗,从五言绝句开始自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了
仅供娱乐,藏尾诗生成器来了

中文歌词自动生成器:来试试自动写歌

文言文自动生成器:来试试自动写古文

现代文自动生成器:来试试用GPT2自动写中文

自动作文生成器:来试试用预训练模型自动写中文作文

0?wx_fmt=png
AINLP
一个有趣有AI的自然语言处理公众号:关注AI、NLP、机器学习、推荐系统、计算广告等相关技术。公众号可直接对话双语聊天机器人,尝试自动对联、作诗机、藏头诗生成器,调戏夸夸机器人、彩虹屁生成器,使用中英翻译,查询相似词,测试NLP相关工具包。
342篇原创内容
Official Account
进技术交流群请添加AINLP小助手微信(id: ainlper)
请备注具体方向+所用到的相关技术点
640?wx_fmt=jpeg

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。

640?wx_fmt=jpeg

阅读至此了,分享、点赞、在看三选一吧🙏


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK