48

GitHub - pwxcoo/chinese-xinhua: 中华新华字典数据库。包括歇后语,成语,词语,汉字...

 6 years ago
source link: https://github.com/pwxcoo/chinese-xinhua
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

README.md

chinese-xinhua

中华新华字典数据库和 API 。收录包括 14032 条歇后语,16142 个汉字,264434 个词语,31648 个成语。

对性能没需求的话,可以用我的新华字典 API 。所有的数据放在 data/ 目录。

Project Structure

chinese-xinhua/
|
+- .vscode/
|  |
|  +- launch.json <-- VSCode 配置文件
|
+- data/ <-- 数据文件夹
|  |
|  +- idiom.json <-- 成语
|  |
|  +- word.json <-- 汉字
|  |
|  +- xiehouyu.json <-- 歇后语
|  |
|  +- ci.json <-- 词语
|  |
|  +- ci.csv <-- 词语(csv 版本)
|
+- scripts/ <-- 脚本文件夹
|  |
|  +- addAbbreviation.py <-- 给成语添加首字母缩写的脚本
|  |
|  +- chengyu.py <-- 下载成语脚本
|  |
|  +- word.py <-- 下载汉字脚本
|  |
|  +- xiehouyu.py <-- 下载歇后语脚本
|  |
|  +- ci.py <-- 下载词语脚本

数据库介绍

成语(idiom.json)

[
    {
        "derivation": "语出《法华经·法师功德品》下至阿鼻地狱。”",
        "example": "但也有少数意志薄弱的……逐步上当,终至堕入~。★《上饶集中营·炼狱杂记》",
        "explanation": "阿鼻梵语的译音,意译为无间”,即痛苦无有间断之意。常用来比喻黑暗的社会和严酷的牢狱。又比喻无法摆脱的极其痛苦的境地。",
        "pinyin": "ā bí dì yù",
        "word": "阿鼻地狱",
        "abbreviation": "abdy"
    },
    ...
]

词语(ci.json)

[
    { 
        "ci": "宸纶", 
        "explanation": "1.帝王的诏书﹑制令。" 
    },
    ...
]

汉字(word.json)

[
    {
        "word": "",
        "oldword": "",
        "strokes": "13",
        "pinyin": "á",
        "radicals": "",
        "explanation": "嗄〈叹〉\n\n 同啊”。表示省悟或惊奇\n\n 嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》\n\n 嗄á叹词。在句首,〈表〉疑问或反问~,这是什么?~,你想干什么?\"\"另见shà㈠。\n\n 嗄shà\n\n ⒈声音嘶哑~声。\n\n 嗄a 1.助词。表示强调﹑肯定或辩解。 2.助词。方言。表示疑问或反诘。\n\n 嗄xià 1.见\"嗄饭\"。 2.见\"嗄程\"",
        "more": "嗄 ga、a 部首 口 部首笔画 03 总笔画 13  嗄2\nshà\n〈形〉\n(1)\n声音嘶哑的 [hoarse]\n终日嚎而嗌不嗄。--《老子》\n(2)\n又如嗄哑,嗄嘶(嗓音嘶哑)\n\nshà\n〈叹〉\n(1)\n什么 [what]--表示否定\n我要丢个干干净,看你嗄法把我治。--清·蒲松龄《聊斋俚曲集》\n(2)\n旧时仆役对主人、下级对上级的应诺声 [yes]\n带进来”。两边军士应一声嗄”,即将牛皋推至面前。--《说岳全传》\n另见á\n嗄1\ná\n〈叹〉\n同啊”(á)。表示省悟或惊奇 [ah]\n嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》\n另见shà\n嗄1\nshà ㄕㄚ╝\n嗓音嘶哑。\n郑码janr,u55c4,gbke0c4\n笔画数13,部首口,笔顺编号2511325111354\n嗄2\ná ㄚˊ\n同啊2”。\n郑码janr,u55c4,gbke0c4\n笔画数13,部首口,笔顺编号2511325111354"
    },
    ... 
]

词语(ci.json)

歇后语(xiehouyu.json)

[
    {
        "riddle": "飞机上聊天",
        "answer": "高谈阔论"
    },
    ...
]

API 接口

GETPOST均可。用GET做示例,POST同理。返回数据格式为JSON

成语

示例1(直接请求成语):

需要两个参数

  • type=idiom 表示需要请求成语
  • word=兴高采烈 表示请求的成语
https://www.pwxcoo.com/dictionary?type=idiom&word=兴高采烈   

示例一

示例2(请求拼音首字母缩写):

需要两个参数

  • type=idiom 表示需要请求成语
  • word=xgcl 表示请求的成语拼音首字母缩写
https://www.pwxcoo.com/dictionary?type=idiom&abbreviation=xgcl   

示例二

歇后语

示例1(请求歇后语):

需要两个参数

  • type=xiehouyu 表示需要请求歇后语
  • riddle=王婆 表示请求的歇后语的语面。可以模糊匹配
https://www.pwxcoo.com/dictionary?type=xiehouyu&riddle=王婆   

示例一

汉字

示例1(直接请求汉字):

需要两个参数

  • type=word 表示需要请求汉字
  • word=吴 表示请求的汉字
https://www.pwxcoo.com/dictionary?type=word&word=吴   

示例一

Copyright Notice

所有的数据都是我从网上找的。仓库本来的目的是因为我以前想做一个成语接龙的东西,但是苦于没有现成可用的数据库,自己就从各个网站抓取整理了一份。放在 Github 是为了方便自己的使用,同时也能方便有类似需求的人不用去做这些 trival 的工作。所有抓取数据的脚本都在仓库里。

本仓库无任何商业目的!如果有侵权行为,请联系我!请不要把我抓走!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK