泥土动物各样性研究当今主要以各样性时势、保管机制和功能作用等为研究要点, 相较于其他生物类群, 泥土动物研究在这些领域的进展相对渐渐國產av 果凍傳媒 肛交, 缺乏智能化、定量化的数据分析和深度挖掘法度是其要紧防碍之一。线粒体基因组[1]、环境DNA[2]、数字全息显微镜[3—4]、高清相机[5]、深度学习[6—7]等智能化监测仪器和现代法度技艺的履行应用, 杀青了小时级以至秒级的自动化监测, 促进了泥土动物研究数据量的快速加多。当今泥土动物研究的数据料理、分析仍主要接受相对浅近的数据库[8], 在面对如斯大规模的数据量时, 产生了数据快速增长和数据处理才气不及之间的矛盾[9—10]。泥土动物辩论研究资格了实验科学、表面科学、筹商科学这三个科学研究范式阶段, 正面对着从第三研究范式到数据最先的第四研究范式转动的快速发展时期[11—13], 显露为第一、二、三研究范式和第四研究范式并存和互相促进的科学研究阶段[7, 14—15]。鞭策基于海量数据的定量化、智能化研究模式, 是处理泥土动物学面对难题的首要机遇, 亦然现代泥土动物各样性研究的前沿领域。
常识图谱(Knowledge Graph)是处理前述难题和挑战的有用道路。常识图谱是一种用图结构建模事物及事物间辩论的数据暗意时事, 其背后是高大的信息库, 不错将信息抒发成更接近东谈主类领会的格式, 提供了一种组织料理和领会剖释海量信息的才气[16]。常识图谱受到学术界的凡俗护理[17—18], 已被应用在动物学、农学、林学等领域[19—22], 但泥土动物领域未见辩论报谈。常识图谱在定量描写泥土动物及辩论事物之间辩论和作用方面具有卓绝上风, 泥土动物常识图谱(Soil animal knowledge graph, SAKG)的研究与发展, 将进一步拓展数据与常识双重最先的研究新标的[23], 促进泥土动物辩论领域的定量化、智能化研究。
泥土动物常识图谱是泥土动物与常识图谱的交叉研究, 体现了泥土动物学与信息科学、筹商机科学、数据库科学等多学科交叉上风, 有助于鞭策泥土动物信息学这一全新学科的发展。本文最初分析泥土动物常识图谱的基础表面常识;然后以“平地生物各样性集结研究相聚”的阶段性效用为例, 发达泥土螨类常识图谱的构建法度;利用基于泥土动物常识图谱的查询、推理和常识暗意等数据挖掘法度, 探讨不错定量化处理的要紧科学问题, 并进一步分析泥土动物常识图谱的发展趋势、不错处理的要紧科学问题与前沿标的。旨在通过平地泥土动物常识图谱的构建和实践, 鞭策泥土动物信息学的发展。
1 泥土动物常识图谱表面法度 1.1 常识图谱界说谷歌于2012年引入常识图谱技艺[24], 通过在搜索查询中找到意见之间的关联来获取常识[25]。常识图谱是好多辩论技艺互相影响和集成发展的产物, 包括语义相聚、常识暗意、骨子论、天然说话处理等[16]。其本质是一种结构化的大规模语义常识库, 用象征时事形容物理寰宇中的意见偏执互辩论系[26], 既包含丰富的语义信息, 又具有图的各样特征。
常识图谱被界说为G={E, R, F}, 其中E, R和F分别代表实体、相干和事实的麇集, 事实被界说为一个三元组(h, r, t) ∈F, h和t分别代表头实体和尾实体, r代表头实体和尾实体之间的相干。图 1是泥土动物常识图谱的一个片断, 图中节点暗意实体, 有向边暗意实体之间的相干, 边的标的标明了实体是手脚主体如故对象出现。三元组(端三甲螨属, 包含, 姬端三甲螨) 抒发了端三甲螨属包含姬端三甲螨这一物种的系统分类事实;三元组(姬端三甲螨, 具有, 特征)、(特征, 具有, 体色) 和(体色, 显露, 棕黄色) 抒发了姬端三甲螨体色是棕黄色的功能性状事实;三元组(姬端三甲螨, 分散, 地舆区域)、(地舆区域, 省, 浙江省), 抒发了姬端三甲螨分散在浙江省的地舆分散事实。这些三元组是抒发泥土动物常识图谱的片断或基本时事, 基于这些实体、实体间相干, 不错杀青泥土动物基础常识、科学问题的基本搜索和深度挖掘。
按照数据着手, 可将常识图谱分为基于相聚百科资源和基于结构化、半结构化、非结构化数据的常识图谱[27—28];按照粉饰范围, 可分为通用和领域常识图谱[29]。通用常识图谱粉饰内容广, 和会实体多, 但准确度不高, 难以借助法度常识库来表率实体、属性和相干。领域常识图谱针对特定领域数据来构建, 实体属性和数值详备表率, 包含更复杂更全面的领域常识。本文接受基于意境侦察和文献辛勤获取的数据来构建泥土动物常识图谱, 属于基于结构化数据构建的领域常识图谱。
常识图谱主要有自顶向下和自底朝上两种构建格式[16]。自顶向下格式最初构建顶层相干骨子, 然后将抽取到的实体匹配更新到所构建的顶层骨子中[30]。自底朝上的格式平直将抽取数据中发现的类别、实体、属性及相干合并到常识图谱中[31]。接受自顶向下的格式构建泥土动物常识图谱。
以大规模语义相聚为基础的语义常识图谱(Semantic Knowledge Graph), 不同于基于文献策量学的科学常识图谱(Mapping Knowledge Domain)。科学常识图谱发祥于Garfield建议的将引文索引应用于检索文献的想想[32], 于2005年被我国粹者引入到辩论研究中[33], 当今已成为国内文献研究的要紧法度。依托科研文献发现实体相干, 杀青从科学常识图谱计量关联到语义常识图谱语义关联的转念, 有助于构建更专科化、法度化的领域常识图谱, 这将是泥土动物学领域一个要紧的研究标的[34—35]。
1.2 泥土动物常识图谱的基本界说、表面模子泥土动物常识图谱是一种语义相聚常识库, 是一个具有有向图结构的常识库, 其中图的节点代表与泥土动物辩论的实体或意见, 图的边代表实体或意见之间的各样语义相干。构建泥土动物常识图谱的主义在于建模、识别、发现和推理泥土动物学辩论意见、事物之间的复杂相聚相干, 基于泥土动物意见、事物相干的可筹商模子, 接受基于常识图谱的数据查询、推理、常识暗意等数据挖掘法度, 处理泥土动物学面对的基础表面和实践应用难题, 促进数据科学范式时间泥土动物学的快速发展。泥土动物常识图谱触及如下基本意见(图 1):
实体:也被称为实例, 每一条履行的数据或信息被称为实体, 如姬端三甲螨、东谈主工林等。
意见:也被称为类型, 用于料理泥土动物常识图谱中的节点, 通过设立属性可结构化实体, 实体与意见的相干是多对多, 如若一个实体属于多个意见, 则其结构为这些意见属性的麇集, 如姬端三甲螨属于物种称号、甲螨亚目、疥螨目、蜱螨亚纲、蛛形纲、节肢动物门、动物界这些意见。
相干:用于料理泥土动物常识图谱中的边, 通过设立属性可结构化边实体, 一个边实体只可属于一个相干, 如包含、分散等。
属性:每个意见或相干不错成立多个属性, 如天目山的属性包括经度、纬度、征象类型等。
1.3 泥土动物常识图谱构建的基础表面法度泥土动物常识图谱的法度论触及多个方面。一般经过为:最初细目常识暗意模子, 然后凭证数据着手选择不同的常识获取技巧导入常识, 接着笼统利用常识抽取、常识和会、常识加工等技艺对构建的常识图谱进行质料普及, 临了凭证需求绸缪不同的常识走访、呈现和挖掘法度, 如图谱可视化分析等(图 2)。
常识着手。不错从多种着手获取泥土动物常识图谱数据, 包括文本、结构化数据库、多媒体数据、传感器数据和东谈主工众包等。每一种数据源的常识化皆需要笼统各样不同的技艺技巧, 结构化、半结构化和文本数据是当今泥土动物常识图谱最主要的常识着手[16, 36]。
常识暗意。是指用筹商机象征形容和暗意东谈主脑中的常识, 以补助机器模拟东谈主的心智进行推理的法度和技艺。常识暗意决定了泥土动物常识图谱构建的产出方针, 即泥土动物常识图谱的语义形容框架、骨子、常识交换语法、实体定名及ID体系[16, 37—38]。
常识抽取。是从不同着手、不同结构的数据中索取常识, 变成结构化数据存入泥土动物常识图谱[5], 其任务一般包括意见抽取、实体识别、相干抽取(实体属性抽取、实体相干抽取)、事件抽取和轨则抽取等[16, 37]。
常识和会。是将不同常识库得到的兼并实体或意见的形容信息和会起来。形容信息不错是同种类型, 也不错是不同类型, 如笔墨、图像、音频、视频等[16, 37]。
常识加工。主要包括基于泥土动物常识图谱的常识检索、常识推理、常识挖掘等, 杀青时事包括语义检索、智能问答、常识挖掘等[16, 37]。
泥土动物常识图谱属于交叉领域, 除了泥土动物学以外, 触及泥土学、生态学、东谈主工智能、数据库、天然说话处理、机器学习、分散式系统等, 具体触及数据库系统、智能问答、推理、保举系统、区块链与去中心化的常识图谱等技艺[16], 辩论研究算法触及传统模子(LaSIE-II、Bootstrap)、基于神经相聚的模子(CNN-CRF、ED-LAN) 和基于图神经相聚的模子(CGN、GNED) 等[36, 39]。
2 泥土动物常识图谱构建法度 2.1 数据着手数据着手为“平地生物各样性集结研究相聚” (Biodiversity along Elevational Gradients: Shifts and Transitions, BEST) 侦察的平地泥土动物数据。限定2022年6月1日, 采集了183个垂直梯度、732个样方、1512个泥土动物样品数据。本文以浙江天目山为例讲明泥土动物常识图谱的构建和数据挖掘法度。
天目山位于浙江省西北部的杭州市临安区(30°18′—30°21′ N, 119°24′—119°27′ E), 主峰仙东谈主顶海拔1506m, 最低海拔约300m。地处中亚热带北缘, 受海洋性季风征象影响, 年均气温8.8—14.8℃, 年均降水量1390—1870mm。海拔600m以下为红壤带, 600—1200m为黄壤带, 1200m以上为棕黄壤带[40—41]。
2021年6月, 在天目山12个20m×20m的海拔梯度样地均分别成立4个2m×2m样方, 在每个样方内随即采集3个15cm×15cm的凋落物层样品, 再使用土钻随即采集3个0—15cm的泥土层样品。按照Krantz和Walter[42]分类系统将泥土螨类坚忍到种, 共获取85个物种、6918只个体。
2.2 骨子构建方针及经过骨子构建的方针是依照泥土动物领域的专科常识, 对平地泥土动物常识体系进行建模, 变成客不雅明确的形容表率, 在结构化、时事化和语义化层面杀青形容、抒发、挖掘、推理和逸想常识的才气, 并通过骨子形容说话使泥土动物专科常识不错被筹商机剖释和处理, 构建经过如下(图 3):
(1) 细目骨子形容的专科领域。在构建骨子之前细目骨子所形容的领域鸿沟以及鸿沟, 包括平地不同垂直带泥土动物的基础常识、与泥土动物糊口有细巧相干的泥土、植被数据等。
(2) 绸缪骨子摘抄模子。以泥土动物专科领域常识为基础, 征集该领域的信息资源, 掌合手辩论的常识体系, 追念、抽象意见并建造骨子摘抄模子, 变成平地泥土动物骨子框架。
(3) 界说中枢类及类的档次结构。对平地泥土动物摘抄模子进行细化和补充, 围绕科学问题和实践应用需求, 梳理、难懂中枢意见及意见类间的档次结构。
(4) 界说骨子属性。通过界说骨子类的对象属性和数据属性, 将泥土动物自身的特征信息, 以及泥土动物与样地、环境因子、现存的常识组织体系的语义关联引入骨子模子, 体现完满的泥土动物常识关联体系。
(5) 骨子考证与评估。构建领域骨子后, 接受群众忖度法, 请领域群众从骨子结构、实践应用场景等方面对所构建的骨子模子进行评估, 进一步修正与完善骨子。
(6) 编程说话形容骨子。通过考证和评估后, 对骨子模子进行时事化暗意, 增强骨子的抒发才气。
(7) 骨子迭代优化。意见模子的构建是一个动态过程, 本文以泥土螨类数据为例构建常识图谱, 后续得到泥土跳虫、线虫、蚯蚓等类群数据后, 可通过上述经过笼统分析, 将其它类群的数据引申到骨子模子中, 进一步迭代和完善平地泥土动物常识图谱的骨子。
2.3 泥土动物骨子构建 2.3.1 泥土动物骨子模子骨子摘抄模子形容了在抽象档次由意见及意见间相干建造的逻辑模子, 借助摘抄模子可梳理骨子构建的意见范围及中枢属性的取值范围。本文接受东谈主工构建的法度, 由领域群众互助和携带, 使用Protégé构建骨子库, 将平地丛林泥土动物骨子成立为7层, 包括泥土动物类、类群类、平地类、样地类、样方类、样品类、物种类。以天目山泥土螨类为主要实例, 用抽象层面自顶向下的要素列举法度, 绸缪的细粒度泥土动物骨子摘抄模子见图 4。
2.3.2 中枢类及类的档次结构在平地泥土动物常识图谱的骨子中, 类是用于形容具有疏导属性的一类意见的麇集, 是构本钱体的要紧因素, 实例和属性皆是对类的明确和讲明。类的高下位相干抒发了类之间的基本相干, 本研究主要凭证一级类对其他类进行类的永诀, 并进行了形容。为了使骨子的构建、料理过程愈加表率, 便于后续的编程责任, 对骨子中类和属性应用英文称号进行了界说。骨子中的类具体如下:
(1) 1个一级类, 即泥土动物类。研究的是平地丛林泥土动物领域骨子构建并将其进行时事化暗意, 因此以泥土动物手脚最高等次类。
(2) 8个二级类, 即类群类(Group)。成立了螨(Mite)、跳虫(Collembola)、线虫(Nematode)、蚯蚓(Earthworm)、甲虫(Beetle)、马陆(Millipede)、蜈蚣(Centipede)、蜘蛛(Spider)用于形容平地丛林主要泥土动物类群。本研究主要添加了螨类的数据属性, 后续不错补充其他类群的数据属性, 进一步拓展类群类偏执之间的关联。
(3) 12个三级类, 即平地类(Mountain)。包括天目山(TMS)、天山野核桃沟(TS1)、天山库尔德宁(TS2)、大别山(DBS)、峨眉山(EMS)、金佛山(JFS)、官山(GS)、玉龙雪山(YLXS)、戴云山(DYS)、大明山(DMS)、高黎贡山(GLGS)和霸王岭(BWL)。
(4) 183个四级类, 即样地类(Plot)。以天目山为例, 成立了样地1 (TMS1)、样地2 (TMS2)、样地3 (TMS3) 等12个位于不同海拔梯度的样地。凭证事实, 不同平地成立的样地数目不同, 例如高黎贡山和玉龙雪山分别成立了31和19个样地类。
(5) 732个五级类, 即样方类(Quadrat)。以天目山的样地1 (TMS1) 为例, 成立了样方1 (TMS1_1)、样方2 (TMS1_2)、样方3 (TMS1_3) 和样方4 (TMS1_4) 4个骨子。
(6) 1512个六级类, 即样品类(Sample)。以天目山样地1的样方1 (TMS1_1) 为例, 成立了凋落物层样品(TMS1_1LL) 和泥土层样品(TMS1_1SL) 2个骨子。
(7) 85个七级类, 即物种类(Species)。成立的物种骨子是天目山的85个泥土螨类物种。
2.3.3 骨子属性界说类自己不及以形容泥土动物专科领域的常识体系, 需要通过界说类的里面属性信息和外部相干信息来形容意见的具体内涵。骨子中类的属性用于形容类具有的特征, 分为对象和数据属性。对象属性揭示类之间的语义相干, 是在骨子中进行逻辑推理的基础, 决定了泥土动物常识图谱的丰富进程和应用效果。数据属性形容类自身的秉性, 使器用体的数据类型进行暗意, 包括文本、数值、日历等多种类型。
(1) 界说骨子对象属性。界说了6个对象属性, 为了增强语义严谨性, 成立了对象属性的英文象征、界说域和值域(表 1)。
(2) 界说骨子数据属性。用来形容骨子自身的特征, 详见表 2:
泥土动物类, 界说了1个数据属性, 形容平地泥土动物常识图谱的主要对象。
类群类, 界说了6个数据属性, 形容类群的生物学分类地位。
平地类, 界说了14个数据属性, 形容平地的基本特征, 其中最低和最高纬度、最低和最高经度, 是为了数据挖掘时候析该平地泥土动物所在位置、分散范围、糊口界限等。
样地类, 界说了21个数据属性, 触及微征象、地形和植被等对泥土动物有要紧影响的因子。
样方类, 成立了5个数据属性, 其中长边、短边、半径用于数据挖掘时筹商和分析样方面积。
样品类, 成立了12个数据属性, 时事、长边、半径和深度等用于筹商和分析样品的面积和体积。采集年份、采集月份和采集日, 可用于筹商和分析泥土动物各样性动态特征。
沈先生 探花物种类, 成立了8个数据属性, 用于筹商分析物种各样性和功能各样性特征。
2.3.4 骨子考证与评估骨子的评估法度一般包括明晰性、一致性、完善性和可膨胀性。明晰性指所界说的平地泥土动物常识图谱的类和属性必须明确, 有科学依据和意旨, 不存在歧义。一致性指泥土动物常识图谱类间的相干在逻辑上必须是一致的, 保证数据推理和挖掘的科学性、严谨性。完满性指所界说的平地泥土动物常识图谱领域内类和属性是完满的, 不错用于形容数据着手中的常识体系。可膨胀性指当领域内出现新的意见时, 平地泥土动物常识图谱的骨子可规模化膨胀。骨子初步构建完成后接受群众忖度的法度, 邀请泥土动物学和平地丛林生态学领域多名群众进行评估。群众以为本文所构建的平地泥土动物领域骨子包含了较完满的平地泥土动物意见体系, 适宜上述评估法度和预期要求, 可进行骨子的说话形容。
2.4 平地泥土动物骨子的时事化暗意图数据库将常识图谱的实体和意见手脚图节点, 实体属性和相干手脚边, 以图的时事进行存储, 相比直不雅地反应常识图谱的里面松手, 成心于进行图查询以及常识推理, 并具有很强的膨胀性。Neo4j是一个开源的图数据库系统, 底层使用图数据结构进行存储, 大幅度普及数据检索的性能, 是当今用于常识图谱存储的主要道路。将平地泥土动物常识图谱存储于Neo4j图数据库中[43]。
最初将获取的实体节点和相干数据分别保存为.csv文献, 然后通过Cypher说话的LOAD CSV语句导入节点和相干。接受Cypher语句将实体和实体间的相干存储到Neo4j图数据库中[44], 变成平地泥土动物常识图谱(图 5)。
3 基于泥土动物常识图谱的分析基于构建的泥土动物常识图谱, 本文围绕生物各样性研究的三个要紧科学问题“分散在那里”、“哪些物种共存在沿途”和“环境条目若何影响物种分散”, 例如讲明常识图谱若何匡助咱们定量化地酬报这些科学问题。
3.1 泥土动物的分散生境头长单翼甲螨Protoribates capucinus分散在哪些乔木丰富度大于20种、坡度大于20°、泥土全氮值大于0.25的生境中?数据挖掘过程如下:
PROFILE
MATCH (a: Species{title: ′Protoribates capucinus′})-[*3..5]-(b: Plot)
WHERE b.richness>20 AND b.slope>15 AND b.TN>0.25
RETURN a.title, b.title
不错发现头长单翼甲螨Protoribates capucinus分散在6个知足前述条目的生境中, 包括TMS1、TMS3、TMS7、TMS8、TMS10、TMS12样地(图 6)。不错进一步推理, 如若补充了12个平地统统的泥土螨类数据, 便不错推理从头疆天山到海南霸王岭跳动25个纬度的大空间圭臬上, 某个或某些泥土动物分散在哪些适宜特定条目的场所或生境。
3.2 特定生境中的共存物种分析头长单翼甲螨Protoribates capucinus和土库曼罗甲螨Lohmannia turcmenica共同糊口在哪些个体数目大于50只、物种数目大于10种、时间节点为5月的生境中?数据挖掘过程如下:
PROFILE
MATCH (a: Species{title: ′Protoribates capucinus′})-[*1..5]->(b: Sample) < -[*1..5]-(c: Species{title: ′Lohmannia turcmenica′})
WHERE b.ind_num>50 AND b.spe_num >10 AND b.month=5
RETURN a.title, b.title, c.title
松手发现头长单翼甲螨Protoribates capucinus和土库曼罗甲螨Lohmannia turcmenica共存在12个生境中, 主要为海拔高度为500—1000m的凋落物层(图 7)。该案例标明泥土动物常识图谱可用于共存物种之间、共存物种与糊口环境因子之间的查询与推理, 有助于揭示泥土动物物种共存特征、共存物种与环境因子之间的相干对共存物种的影响等科学问题, 在生物间作用、环境过滤对各样性保管的孝敬等关键科学问题中将阐发要紧作用。
3.3 复杂环境条目对泥土动物分散的影响海拔高度大于300m、坡度大于15°、乔木物种丰富度大于15种、泥土有机碳含量大于10%、泥土pH值大于3.7、泥土有用磷含量大于7mg/kg的复杂环境条目, 影响哪些个体数目大于50头、在5月份活跃在天目山的泥土螨类的物种分散。数据挖掘过程如下:
PROFILE
MATCH (a: Plot)-[*1..5]-(b: Species), (c: Sample)
WHERE b.num>50 AND a.elevation>300 AND a.slope>15 AND a.richness >15 AND a.OC>10 AND a.pH>3.7 AND a.AP>7 AND c.month=5
RETURN a.title, b.title
松手标明, 前述笼统的复杂环境条目共同影响20个物种在天目山的分散, 包括头长单翼甲螨Protoribates capucinus、Eremulus avenifer、Tectocepheus velatus等(图 8)。
前述3个案例仅是基于天目山泥土螨类数据的实践和应用, 基于平地泥土动物常识图谱的查询、推理和常识暗意等法度, 不错进一步挖掘更多科学问题。如:(1) 哪些泥土动物不错同期生活在泥土pH值在4—7的凋落物层和泥土层中。(2) 哪些泥土动物是特定平地的特有种, 至少在3次数据侦察中发现其只分散在该特定平地。(3) 哪些泥土动物是统统海拔高度的广布种, 凡俗分散在从200—3000m的平地中。(4) 哪些泥土动物是跨纬度平地生态系统的广布种, 同期分散在从温带到热带的平地中。(5) 泥土有机碳含量大于6%、平地坡度大于15°、每公顷树木胸径大于30mm的生境中共存泥土动物的体长、体宽、生物量范围。(6) 是否存在着在统统平地皆是上风种的泥土动物, 其个体数目在统统平地的占比皆大于10%。(7) 什么性状的泥土动物更心爱生活在凋落物层而不会生活在泥土层。
4 辩论构建泥土动物常识图谱是一项系统性常识工程。相较于其他研究法度, 泥土动物常识图谱在处理泥土动物学的基础表面、应用实践方面具有独有的上风和作用。
4.1 泥土动物常识图谱的特色与上风(1) 友好的可移植性
依据生物地舆学和生态学的基础表面常识, 不错杀青泥土动物常识图谱的移植、分享和完善。以“泥土动物-包含->类群->分散->平地-包含->样地-包含->样方-包含->样品-包含->群落-包含->物种”的15元组为中枢对常识进行抒发, 通过一个完满的常识链路, 将泥土动物数目和性状信息与其糊口环境中植被、泥土、地形、征象等信息抒发出来, 杀青了基于泥土动物常识图谱对科学问题的解释和挖掘。该常识抒发格式和常识链路不错横向移植到其他生态系统中, 如农田泥土动物常识图谱、湿地泥土动物常识图谱等。
(2) 优良的可膨胀性
可膨胀性是泥土动物常识图谱的一个基本秉性, 当专科领域出现新意见或需要添加新常识时, 不错便捷地杀青常识骨子的规模化膨胀[45]。构建的平地泥土动物常识图谱, 以泥土动物类为启程点, 不错进一步拓展泥土动物与植物、微生物、哺乳动物、鸟类等常识意见之间的关联, 构建泥土动物与其他生物之间相互互联的复杂常识图谱。又如基于本研究中的平地类, 后续不错进一步拓展长白山、武夷山、贡嘎山等骨子类的实例和属性, 构建中国乃至寰球平地泥土动物常识图谱。
4.2 泥土动物常识图谱不错处理的科学问题(1) 泥土动物学基础科学问题
相干于农作物害虫[46]、林业[47]、医学[48]等领域, 泥土动物学对常识发现和常识梳理的显露性和科普性仍显不及。如姬端三甲螨分散在我国哪些省、市、县的哪些生境场所, 这些分散场所年均温、年均降水量、泥土有机质含量分别收支几许。天然也曾积蓄了较多的数据和辛勤, 由于进攻有用的常识抒发时事, 仍然难以酬报这些泥土动物学的基础科学问题。泥土动物常识图谱还不错精确地量化其他基础科学问题, 如年均温小于就是10℃的地区生辞世哪些泥土动物;同种泥土动物在不同分散区的体长、体宽等功能性状收支几许;某个泥土动物物种喜好什么生境, 喜好与哪些物种共存在沿途等。
(2) 泥土动物各样性保管机制
泥土动物各样性保管机制是泥土动物学研究的中枢内容之一[49]。当今解释泥土动物各样性保管机制的假说主要包括中性表面、生态位表面等[50—51], 极力于于处理的科学问题麇集于扩散[52]、环境过滤[53]和生物间作用[54]的影响。由于一直难以精确量化前述基本科学问题, 导致辩论研究进展渐渐。基于泥土动物常识图谱的分析与挖掘, 有望量化前述辩论科学问题。如量化并酬报哪些DNA序列与特定范围的体长、体宽等功能性状、特定范围的泥土、植被、地形等环境条目之间存在细巧辩论;在给定泥土、植被、地形、征象等特定环境条目下, 有哪些泥土动物不错存活, 这些存活的泥土动物在数目、性状、DNA信息等方面有什么顺应性特征和一般性规则;在给定泥土、植被、地形、征象等特定环境中, 感兴味的泥土动物之间是否不错共存, 在什么环境范围内共存相干最权臣。
圭臬是泥土动物各样性保管机制研究护理的一个要紧问题[55], 基于泥土动物常识图谱的数据挖掘不错匡助处理圭臬辩论的科学难题。圭臬是联络时势与过程的桥梁和纽带[56—57], 辩论研究讲明注解地舆距离和环境因子对泥土动物分散时势的影响具有圭臬依赖性[58—59], 但圭臬一直是泥土动物各样性保管机制研究的难点。基于严谨的常识体系和常识链路, 泥土动物常识图谱有后劲将“种群-群落-样地-生境-局地-区域-寰球圭臬”的泥土动物各样性与其糊口环境的关联抒发出来, 再通过数据挖掘等格式发现多圭臬、跨圭臬的科学规则。
(3) 泥土动物各样性功能作用
泥土动物功能作用是泥土动物学、群落生态学等辩论研究的要紧问题[60—61], 现代技艺法度和数据科学的交叉与耦合有助于处理该问题[62]。泥土动物活跃于复杂系统中, 当今的研究框架难以将各样性子系统、外部环境子系统、功能作用子系统有机地辩论在沿途[61, 63], 难以有用地抒发泥土动物功能作用与其他子系统所具有的互相依赖性和非沉稳性特征[64], 在处理海量数据和复杂相干过程中面对诸多贫困和挑战。泥土动物常识图谱不仅不错建造子系统里面要素间的横向关联(图 9a), 还不错构建跨子系统的细粒度要素间的纵向关联(图 9b), 为研究泥土动物各样性功能作用提供细粒度的、可量化标的和相干的研究模式。
(4) 泥土动物学的实践应用
泥土动物常识图谱在泥土动物各样性保护、泥土质料提高、泥土健康料理、农家具性量普及等方面, 皆将有很大的应用后劲。在泥土动物常识图谱中构建与东谈主类行为辩论的类, 如农药施用类、化肥施用类、农业灌溉类、耕耘格式类、农家具产量类、农家具性量类等, 便不错基于常识体系和常识链路, 挖掘某些农药、化肥、灌溉、耕耘等特定料理模式下会糊口哪些泥土动物, 以及这些泥土动物的性状、DNA信息特征, 这些料到效用将为泥土质料、泥土健康及东谈主类健康评估等要紧科学问题提供有用的数据和法度[65]。
5 论断泥土动物常识图谱正处于萌芽时期國產av 果凍傳媒 肛交, 行将迎来快速发展阶段。接受哪些模式和法度构建科学的泥土动物常识图谱, 接受哪些数据挖掘法度有用发现科学规则, 利用泥土动物常识图谱处理哪些关键科学难题, 皆是泥土动物常识图谱发展的前沿领域和要紧标的。先容了泥土动物常识图谱的基础表面和构建法度, 以构建的平地泥土动物常识图谱为例, 围绕分散在那里、哪些物种共存在沿途和环境条目若何影响物种分散这三个要紧科学问题, 探讨了泥土动物常识图谱的上风和不错处理的科学问题。研究论断将鞭策泥土动物学、信息科学和数据科学的交叉研究, 促进泥土动物信息学新领域的发展。