荀子Logo

中国古代典籍跨语言知识库平台

本平台由王东波教授所主持的国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331)研制,利用深度学习、自然语言处理和文本挖掘等技术,构建了包含多维度知识的跨语言知识库,并搭建了相应的机器翻译和检索平台。

平台核心功能

数字人文教育

提供基于Python的古籍文本数字人文研究教材,并开放所有相关代码以供学习。

获取随书代码

开放模型资源

开源SikuBERT及荀子系列大语言模型,赋能研究者与开发者进行二次开发与创新。

查看SikuBERT

语料库数据示例

二十四史古现对齐语料示例

原文 译文 来源
及壯大,婉順得婦人道。等到雙長大了,性情柔順,謹守婦道。汉书·卷九十八
嘗許嫁未行,所許者死。曾經許配了人家,還没有出嫁,對方就死了。汉书·卷九十八
皇后自有子後,希復進見。皇后自從生下兒子之後,很少被元帝召見。汉书·卷九十八
上亦以皇后素謹慎,而太子先帝所常留意,故得不廢。元帝也覺得皇后一向謹慎,而太子又是先帝所器重的,因此没有廢掉太子。汉书·卷九十八

二十四史古现对齐词性标注语料示例

原文 译文 来源
八年/t/,/w/散/v/還/v/元/d/屯户/n/,/w/別/d/簽/v/南陽/ns/諸/r/户/n/計/n/,/w/立/v/營田使司/nx/領/v/之/r/。/w至元/t/八年/t/,/w/遣散/v/原來/d/屯田/v/的/u/人家/n/,/w/另行/d/發派/v/南陽/ns/各/r/類/n/人家/n/,/w/設/v/營田使司/nx/統轄/v/。/w元史
陝西/ns/屯田/n/總管府/nx/:/w/世祖/nr/至元/t/十一年/t/正月/t/,/w/以/p/安西王府/ns/所/u/管/v/編民/n/二千/m/户/q/,/w/立/v/櫟陽/ns/、/w/涇陽/ns/、/w/終南/ns/、/w/渭南/ns/屯田/n/。/w陝西/ns/屯田/n/總管府/nx/:/w/世祖/nr/至元/t/十一年/t/正月/t/,/w/命令/v/安西王府/ns/所/u/轄/v/編入/v/户籍/n/的/u/百姓/n/兩千/m/家/q/,/w/設立/v/櫟陽/ns/、/w/涇陽/ns/、/w/終南/ns/、/w/渭南地區/ns/的/u/屯田/n/。/w元史

先秦典籍古英对齐语料示例

原文 译文 来源
偕偕士子、朝夕從事。An officer, strong and vigorous,Morning and evening I am engaged in service.诗经·北山
王事靡盬、憂我父母。The king's business is not to be slackly performed;And my parents are left in sorrow.诗经·北山
涉彼北山、言采其杞。I ascend that northern hill,And gather the medlars.诗经·北山
偕偕士子、朝夕從事。An officer, strong and vigorous,Morning and evening I am engaged in service.诗经·北山

《资治通鉴》古白英三语平行语料示例

原文 现译 英译 来源
如此者三,昭姿容無變。这样一连三次,魏昭的态度和脸色始终没有改变。The scene was repeated three times, and Wei Zhao showed no signs of resentment or dismay.汉纪·四十七
後事露,眾人咸謝服焉。后来这件事传开,大家全都佩服郭泰。This was discovered later, and everyone thanked Guo Tai and acknowledged his wisdom.汉纪·四十七
覽宜急屏斥,投畀有虎。因此,侯览应被急速斥退,投到豺狼虎豹群中。Hou Lan should be removed at once and thrown to the tigers.汉纪·四十七
緄前討蠻荊,均吉甫之功。冯绲从前讨伐荆州的叛蛮,曾有和吉甫同等的功劳。Feng Gun previously defeated the barbarians of Jing province, and his merit is comparable to that of [Yin] Jifu.汉纪·四十七

数据申请流程

  1. 凡符合并愿意遵守以下条件者,可申请获得本平台的资源:
    • 申请者为从事科研活动的机构;
    • 承诺所获得的资源仅用于学术研究,不被用于任何商业目的;
    • 承诺不以任何形式将所获得的资源扩散给第三方;
    • 承诺在发表论文和申报成果时遵照学术规范如实声明或标注使用了所获得的资源。
  2. 点击下方的“申请数据”按钮,按页面中的要求逐项填写相关内容,最后点击提交申请。
  3. 提交申请之后,我们将对您的信息进行审核。
  4. 若审核通过,资源使用人的Email将会收到所申请的学术资源。

免责声明

1、本平台所有学术资源的原始语料著作权归原著作权人所有,请所有资源申请和使用者在使用资源时充分尊重原著作权人的知识产权。

2、为学术研究的目的,我们将原始语料加工成为对应的学术资源,但不对原始语料内容的准确性、可靠性、正当性、合法性等负责,更不对其内容承担任何法律责任。

3、为学术研究的目的,我们将原始语料加工成为对应的学术资源,但不对资源质量向资源申请和使用者作任何承诺,也不对资源准确性、可靠性等负任何责任。

4、申请和使用者在资源使用过程中,若因本平台资源的错漏造成差错或损失,本平台不负责,更不承担任何法律责任。

5、申请和使用者申请和使用了本平台的任何资源,即视同认可并接受了本平台首页、免责声明等规定的所有条款。

6、本平台保留对首页、免责声明、《承诺书》等规定的各条款进行修改的权利,且修改后的内容仅在本平台公布,恕不分别通知资源申请和使用者。资源申请和使用者若继续使用本平台的资源,即视同接受修改后的条款,否则,请停止使用并自行删除所获得的资源。