【刘伯温今年今期东方心经_马会传真图片今年今期】 “全息字典”正式上线:古今汉字任你查

  • 时间:
  • 浏览:0
  • 来源:10分时时彩源码_10分时时彩平台

  “全息字典”:古今汉字任你查

  快捷、权威、形象——准确查找一有五个 难检字的相关信息再不多再跑遍古籍阅览室,翻便“大部头”,只需轻点鼠标——登录汉字全息资源应用系统,点击现代通用字集,搜索要查找的字,不仅可不都还可以显示其现代字形、字音、字义信息,还可不时需查到该字从甲骨文、金文到篆书、楷书的历史字形演变过程,从《说文》《尔雅》《方言》《释名》老要到《康熙字典》等历代辞书对该字的释义,及其在什么都常用古籍文献中被使用的清况 。

  日前,国家语委重大基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”正式启动上线。该项目旨在运用现代中文信息除理技术,构建一有五个 具有多维关联关系、科学系统、高效实用的汉字全息数据库。

  “无论是初学汉字的小学生,还是研究汉字的学者,系统都可不时需提供相应的帮助。”项目主持人、北京师范大学教授王立军介绍,系统采用的多层级字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集、全字符集等。常用字集可不时需满足中小学基础教育领域的一般时需;现代通用字集可不时需满足社会文化领域一般汉字使用者的时需;古籍印刷通用字集面向具备一定古汉语知识、阅读一般古籍文献的用户;全字符集则可不时需满足汉字研究的专业人士需求,为专业研究提供支撑。

  借助资源库,给汉字家族绘家谱

  作为一名古文字爱好者和研究者,张华的书桌上摆满了各种字典、工具书——查找一有五个 字在不共同期形、音、义的演变老要要翻阅多部“大部头”可不都还可以找到相对准确、权威的答案,而线上的什么都汉字数据库什么都又发生收录不全、权威性差等诸多大问題。如今,“汉字全息资源应用系统”的正式上线将会要我再不多再犯难——借助资源库,“古今汉字任你查”已不再是梦想。

  本期上线的系统含有字符集4种,其中常用字集310000字,通用规范字8105字,古籍印刷字16490字,全字符集81722字;还有辞书20种,古籍文献1000种,历代字形图41567五个。其中包括小量的图形信息资源和文本信息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,含有了古今各个时期文字的形、音、义、用、码五大方面的重要信息。

  什么都数据库,可不时需说是“海量”。可不都还可以可不都还可以不能 庞大的信息量,是怎么还可以做到相互对应、关联的呢?

  将会说建立数据库是给汉字家族绘制一张家谱,可不都还可以可不都还可以不能 建立关联则是搞清谱系、辈分等关系。“首先是汉字属性的分解。构建一有五个 具有多淬硬层 关系的汉字实用数据库,时需以汉字的属性作为基本的依托。”北京师范大学教授王宁指出,团队从20世纪90年代结束英语 总结汉字的属性,除形、音、义之外,还增加码、用有五个 次责。码是汉字在计算机中的编码,用是汉字的使用,有之前 做了小量的属性细化研究,原先都有条件将笼统的汉字个体的资源库,改造为汉字的属性库,除理关联的多淬硬层 大问題。

  王宁解释:“其次是层次的确立,根据‘汉字效用递减率’,什么都人将汉字分为常用-通用-适用-罕用-无用五个层。第一、二层次含有3100000字,以外的字只存记忆,不做淬硬层 开发,原先一方面可不时需在应用中扩大有用信息的使用度,什么都人面将垃圾信息、无用信息退出关联,不干扰有效信息的集合和调用。”

  “再次就说 我中介的寻求,什么都人继承传统语言学的研究成果,以《说文解字》的935五个小篆及其重文为中介来关联。古文字的确切识读,绝大次责是从《说文》结束英语 的,原先就保证了不同形制、不同字体、不共同代汉字的最大限度关联。”王宁补充道,正是依靠《说文》小篆哪些“核心家族成员”作联系,汉字家族实物不同族群的谱系才得以绘制在共同。

  沟通古今,提供汉字准确属性信息

  实现让通用规范汉字沟通古文字、繁体字,是该资源库的又一重要特征。据介绍,系统的主体字集是国家语委2013年宣告 的《通用规范汉字表》的810五个规范汉字及其关联字形。《通用规范汉字表》属于僵化 字系统,分为一级字表(即常用字表,310000字)、二级字表(10000字)、三级字表(110005字)。《通用规范汉字表》作为数据库子库的B库,直接和A库(传承字、繁体字和隶定字)关联,进而与小篆等古文字(C库)关联,从而实现了古今、简繁汉字的有效贯通。

  怎么还可以保证对收录的每个汉字形、音、义解释的权威性?

  王立军介绍,系统的除理最好的依据是:选取历代具有代表性的辞书,并选取最优的版本作为搭建框架的基础素材,以此为基础建构数据之间的淬硬层 关联。选取的辞书包括从《尔雅》《说文》《释名》《方言》《广韵》《集韵》《康熙字典》《汉语大字典》《新华字典》和《通用规范汉字字典》等。在字形方面,僵化 字的部首采用10009年国家语委发布的《汉字部首表》,即20一有五个 主形部首和99个附形部首,非僵化 字采用214部首体系,来源于《康熙字典》。僵化 字和繁体字的笔画数属性参考《通用规范汉字字典》等。特征类型(六书)属性参考《说文解字》。字音方面,现代汉语拼音和注音字母主要参考《通用规范汉字字典》和民国时期《国语辞典》等;近代音来源于《中原音韵》;中古音来源于《广韵》。字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。

  多种属性的综合呈现,可不时需加深什么都人对每个汉字的理解。比如“既然”的“既”和“即使”的“即”,在使用过程中容易混淆,但参考小篆字形就不多再了——“既”是一有五个 人背对着饭桌,表示吃完了,什么都字就说 我表示将会发生了;而“即”是一有五个 人正对着饭桌,靠近它,还没吃饭,什么都是表示即将进行的。了解了什么都层面,理解就加深了,也就先要出错了。

  汉字都有一有五个 个“孤零零”的符号,汉语文献正像躯体的血肉,充足着汉字殿堂的内容。在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括十三经、二十五史、二十二子等三大典籍系统,提取汉字在哪些文献中的使用例句,供研究者参考使用。

  多种检索,满足不同用户需求

  与查字典类事 ,方便检索也是系统的一大特征。为方便使用者更便捷地输入时需检索的字,系统提供了单字、拼音、部首、部件、笔画等有有一种可输入的检索最好的依据,使用者可不时需根据什么都人的喜好和需求,选取适合什么都人的最好的依据。除单字检索外,还可不时需满足综合检索、专书检索和历代字形检索。

  “你看,‘典’字是两只手捧着书卷,这多么形象,对于文史研究者来说用于研究也太方便了,我现在就想拥有。”事先演示完动画,现场主持人、北京师范大学文学院教授康震兴奋地说。

  “资源库可作为文字和文化爱好者提高文化知识和综合素养的学习平台,为传统文化爱好者提供权威的学习内容;可不时需作为基础教育及汉语国际教育领域的教学平台,为学生学习、教师备课提供充足的教学资源,从而更好地服务我国基础教育;可作为文字学及相关专业领域专家学者的科研平台,为专家学者提供对数据资源进行淬硬层 挖掘的工具,弥补传统手工获取资源、联系资源最好的依据的局限;可作为汉字类数字化产品的开发平台,为开发者提供海量的经过专业学术加工的可靠汉字属性资源。”王立军指出。(记者 周世祥 靳晓燕)