
欢迎您使用荀子古籍大语言模型服务,荀子古籍大语言模型作为古籍领域首个开源大语言模型,能够提供古籍文本处理、古籍知识问答等古籍领域服务。荀子古籍大语言模型将基于以下《用户服务协议》(以下简称"本协议")为您提供服务。
特别提示:为使用荀子在线服务,请您务必审慎阅读、充分理解本协议各条款内容,特别是免除或者限制责任的条款、对用户权利进行限制的条款等。限制、免责条款或者其他涉及您重大权益的条款可能以加粗形式提示您重点注意。
除非您已充分阅读、完全理解并接受本协议所有条款,否则您无权申请或使用本平台服务。您申请、使用本平台在线服务,即代表接受本协议。
未成年人特别条款:如果您因年龄、智力等因素而不具有完全民事行为能力,请在法定监护人(以下简称"监护人")的陪同下阅读和签署本协议。
若违反本协议:您有违反本协议的任何行为时,本平台有权根据您违反约定的情形单方采取限制、中止或终止向您提供服务等措施,并有权追究您相关责任。
指南京农业大学王东波教授团队依托通义千问大语言模型推出的古籍垂直领域大语言模型。
指用户为使用本服务在对话框进行的文本输入。
指本服务根据用户输入而相应输出的文本内容。
荀子古籍大语言模型是基于Transformer decoder-only架构,在开源大语言模型Qwen的基础上进行古籍领域优化得到。Decoder-only为transformer架构的一个重要组成部分,主要应用于文本下文预测,在应用于大语言模型构建的过程中,通过大批量的文本续写任务实现对于语言文本的学习。
荀子古籍大语言模型的训练过程充分利用了大量的古籍原始文本与精标注数据,并采用了多种优化策略,确保模型能够高效地学习和适应古籍领域的需求。
训练数据包括海量的古籍原文、古籍文本标注数据、古文化常识数据等。这些数据经过严格筛选和预处理,保证了数据的质量和相关性。
荀子古籍大语言模型首先在大规模通用语料库上进行继续预训练,在开源模型千问的基础上进行了继续训练,学习古代汉语的语法结构和语义特征。这一步骤使得模型具备了庞大而体系化的古籍领域知识。
在继续预训练的基础上,团队进一步构建了古籍领域的高质量标注数据,包括古籍词性标注、古籍翻译、古籍阅读理解等古籍领域特有的指令数据。之后,在庞大的指令数据集基础上开展了指令微调,构建了适用于古籍领域任务的对话模型。
训练完成后,团队构建了古籍领域大语言模型评价基准,ACH-Bench,用于针对古籍领域评价大语言模型的性能,荀子古籍大语言模型在同等参数量模型中表现优越。
目前,荀子古籍大语言模型服务向社会各界开放注册服务,为落实国家法律法规的有关实名认证要求,使您更好地使用平台服务,您需要先提交您的真实个人信息(包括姓名、身份证号、手机号、单位和住址)交由本平台审核。审核通过后,本平台将为您提供平台账户、密码并与您的个人信息绑定。
注意:
您应该自行保管好您的账号信息(包括账号、密码等)。因您对账号信息保管不当、主动泄露或遭受他人攻击、诈骗等行为导致的损失及后果,均由您自行承担。如发现任何未经授权使用您账号登录使用本服务或其他可能导致您账号遭窃、遗失的情况,建议您立即联系我们。
若我们发现账号使用者并非账号注册人时,有权暂停向用户提供本服务,并有权采取进一步措施。您不应将账号或密码转让、出借、销售或以任何脱离您控制的形式交由他人使用,您对使用您的账号发生的所有活动负责,且转让、出借账号导致的任何后果均由您本人承担。
本服务适用于古籍学习者、爱好者和研究者,主要应用于古籍领域的各类文本相关问题。若您未满18岁,需由在监护人的许可下申请注册。
主要服务范围:
具体可应用于:
本服务提供的内容均由荀子古籍大语言模型生成,荀子古籍大语言模型采用国内已备案的通义千问大模型作为模型底座进行预训练和优化训练。大模型作为一项新兴人工智能技术,虽在文本处理上表现出了优越的性能,但仍存在一些不可避免的问题,具体如下:
综上所述本服务提供的内容仅供参考,不构成任何建议或承诺。
此外,作为本服务使用者,您在使用服务时应当积极承担信息安全义务,您承诺不对本服务采取以下行为:
本平台非常重视对用户个人信息的保护,您申请注册本服务并使用本服务后,会产生两种类型数据并存储于本平台服务器中:您的个人信息与您与荀子古籍大语言模型的对话数据。
与本平台相关的一切著作权、商标权、专利权、商业秘密等知识产权,以及本服务输出的相关所有信息内容均受法律法规保护,由大汉软件及其关联方享有完整的知识产权、所有权等合法权利。
用户使用本平台服务上传、发布或传输内容即代表了用户不可撤销地授予本平台及关联方非排他的、无地域限制的、永久的、免费的许可使用(包括存储、使用、复制、修订、编辑、发布、展示、翻译、分发上述内容或制作派生作品等商业或非商业使用)及可再许可第三方使用的权利,以及可以自身名义对第三方侵权行为取证及提起诉讼的权利。
未经本平台授权或同意,任何人不得为本协议约定之外的目的获取、使用前述数据,亦不得以任何形式将前述数据提供给他人。
服务会利用您终端设备的处理器和带宽等资源,相关费用需自行承担。
由于互联网本身所具有的不稳定性,本平台无法保证服务不会中断。系统因有关状况无法正常运作,使用户无法使用服务或使用服务受到影响时,本平台对用户或第三方不负任何责任。
因您的过错导致的任何损失由您自行承担。
本平台有权在提前告知的前提下,对本平台的全部或部分服务内容进行变更、暂停、限制、终止或撤销,用户需承担此风险。
用户违反相关法律法规或本协议约定导致的任何后果,均由用户独立承担责任、赔偿损失。
用户干扰本服务的运行或干扰其他用户对本服务的使用的,本平台有权要求其赔偿损失。
用户有违反“3.4服务使用规范”行为的,本平台有权采取警示、限制功能、暂停或终止提供服务、删除违法违规信息、锁定账号等处理措施,并保存有关记录。
发现侵权或其他违法信息,请发送至邮箱:zhaozhixiao@stu.njau.edu.cn。
认为本平台不恰当地限制了您使用本服务的能力,请发送至邮箱:2022114011@stu.njau.edu.cn。需包含材料:账号信息、身份证或护照复印件(对自然人)、单位登记证明复印件(对单位)、账号当前状态、账号因何种使用情形被采取措施以及希望恢复使用本服务的能力。
提出投诉或申诉后的5个工作日内反馈相关情况。