科学数据汇交质量评价指标体系 德尔菲法第一轮问卷

尊敬的专家:
        您好!为构建科学、合理、可行的科学数据汇交质量评价指标体系,本研究采用德尔菲法开展专家咨询。本次为第一轮咨询,核心目的是收集您对指标体系构建的初始意见与建议。您的专业见解对本研究至关重要,恳请您结合自身研究与实践经验完成本次问卷。问卷填写无需过度耗时,您的真实判断即是对我们最大的支持。感谢您的鼎力相助!

第一部分 专家信息

本部分旨在了解您的专业背景、研究领域及相关实践经验,以便后续对专家意见的可信度与代表性进行分析。所有信息仅用于本次研究,严格保密。
1.您的姓名:
2您的年龄:
3.您的学历:
4.您的职称
5.您从事的研究领域/专业方向:
6.您的所在单位及部门:
7.从事科学数据相关工作(如数据汇交、数据管理、数据质量评价等)的年限:
8.是否参与过科学数据汇交质量相关的项目/研究:
9.您对科学数据汇交质量评价指标体系的熟悉程度:
第二部分  专家意见调查

本部分基于前期文献梳理,初步拟定了科学数据汇交质量评价指标体系的一级指标,二级指标及评价标准。请您结合专业认知,对各维度的重要性进行判断,请选择您认为合适的分值。同时可补充遗漏的重要维度或指标。
(一)科学数据汇交质量评价对象(一级指标)
该体系评价对象分为元数据模型、元数据内容、实体数据以及是否合规四个层面。
1.元数据模型(表设计层面):在科学研究中,用于采集、生产、管理、描述和最终汇交科学数据的软件平台或信息系统。
2.元数据内容(表内容层面):是描述数据的数据,是描述实体数据文件的信息。元数据以页面形式呈现,每一个科学数据集均有一个元数据页面,展示该数据集的名称、大小、内容描述、学科、类型、相关过程文件等描述信息。
3.实体数据层面:是数据文件本身,是结构化或非结构化的数字对象,聚焦于数据内容本身的质量。
4.合规层面:合规层面是对科学数据汇交整体过程进行的前置性审查与系统性要求。该层面是确保数据在产生、管理与汇交的全过程中,符合国家法律法规、科研伦理与人类遗传资源管理等相关强制性规定。
针对上述一级指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
(二)科学数据汇交质量评价指标(二级指标)
二级指标基于不同的评价对象进行选取,请您判断各评价指标对科学数据汇交质量评价的重要性。二级指标选取问题,请在“修改意见”处填写。
1.本题的一级指标为“元数据模型
(1)规范性:元数据方案的设计严格遵循相关的国际、国家、行业或领域标准与规范。标准符合度检查、必填项完整性。
(2)互操作性:指元数据能够被不同系统、平台或工具理解和处理的能力,便于数据的跨领域、跨机构交换与集成。
(3)安全性:指元数据方案中包含必要的数据安全与隐私保护信息,能够明确标识出数据的敏感程度、访问权限、使用约束以及是否包含个人隐私信息。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
2.本题的一级指标为“元数据内容
(1)唯一性:指在确定的范围内,每一个数据集、每一个元数据记录都具有唯一且稳定的标识符。
(2)一致性:指元数据记录内部、以及元数据与它所描述的数据实体之间,不存在逻辑矛盾和冲突。
(3)准确性:指元数据内容真实、无误地描述了所关联数据实体的特征。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
(4)完整性:
1)初始完整性:指在首次汇交时,元数据记录中所有应填写的字段都已填写,没有空值或无效占位符。
2)持续完整性:当数据发生变化或进入新的阶段时,相关的元数据字段是否得到及时更新与补充,确保记录的完整性不被破坏。
(5)可信性:指元数据内容因其来源可靠、表述客观、可被验证而值得信赖的程度。
1)来源权威性: 检查“数据创建者”、“贡献者”、“所属项目”等信息是否来自可信的机构或知名的科研项目。
2)过程透明度: 评估“采集/生成方法”、“数据处理过程”等字段的描述是否清晰、详细。
3)佐证信息: 检查是否提供了关联的论文、技术报告、算法代码库等作为佐证。
(6)可用性:指元数据能有效地帮助用户判断该数据集是否满足其特定需求,并提供了足够的信息以便用户能够正确地获取和理解数据。
1)关键信息完备性: 检查对于数据使用至关重要的信息是否齐全。
2)粒度适宜性: 评估元数据描述的粒度是否与数据集的复杂度相匹配。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
(7)易理解性:指元数据内容使用清晰、无歧义的语言和术语进行描述,易于领域内外的用户理解,包含术语规范性、语言清晰度。
(8)可访问性:指根据元数据中声明的访问方式和权限,用户能够顺利地定位并获取到数据实体。
1)访问链接/标识符是否指向正确的数据资源。
2)如果数据是“受控访问”,则整个申请-授权-获取流程是否通畅、高效。
(9)可追溯性:确保数据汇交的全流程可查询、可验证,需记录每笔数据的汇交人、汇交时间、汇交路径、修改记录等信息,形成完整的追溯链条。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
3.本题的一级指标为“实体数据层面
(1)准确性:准确性是指数据记录的信息是否存在异常或错误。数据真实反映原始观测或采集结果,误差值在允许范围内,关键字段需经校验。
(2)完整性:
1)在汇交初期进行评价,指数据集合中所需的数据项、记录或文件没有缺失,覆盖了预期的全部内容。记录缺失率、属性值缺失率、文件完整性
2)在用户二次使用时进行评价,指数据集在时空范围、主题覆盖、观测指标等方面是否达标,不能缺少关键字段,字段属性必须满足结题项目。
(3)规范性:数据的存储格式、字段命名、类型标注(日期格式、数值单位)是否符合预设标准或行业规范。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
(4)一致性:指数据集合内部、或与其他相关数据集之间,在逻辑和表示上不存在矛盾。
(5)可获取性:指数据实体本身能够通过公开或受控的方式被用户顺利下载或访问。
(6)可用性:指数据在满足基本可获取性的基础上,其内在属性与外在支撑能够支撑高效、准确和广泛的二次分析、应用与集成的综合能力。
1)全面性与价值密度: 数据内容是否丰富、覆盖是否全面、是否包含支撑关键科学问题的高价值信息,以及是否有证据表明其已产生或具有产生科研成果的潜力。
2)结构与互操作性: 数据是否以机器可读、标准化的方式组织和表示,能够被软件工具轻松解析并与其他数据源无缝集成。
3)理解与再现成本: 用户需要花费多少时间、技术才能正确理解、预处理并复现基于此数据的研究分析。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
4.本题的一级指标为“合规层面
(1)伦理合规性:当项目涉及伦理问题时,应提供由伦理委员会出具的伦理审批文件,批件中的项目内容应与提交的数据保持一致。
(2)人遗:当项目产生的数据资源涉及人类遗传资源时,应提供国家人类遗传资源管理办公室出具的审批文件。
针对上述指标是否需要增加、删减或修改指标条目,请您提出针对性意见(无意见可不填写):
(三)科学数据汇交质量评价等级与评价标准
本部分为各二级指标的评价等级与评价标准,评价等级分为完全达标、基本达标、不达标三个等级,请您据此对相应等级的评价标准提出改进意见,无意见可不填。
1.元数据模型维度:
(1)规范性
完全达标(5分):元数据方案完全遵循国际、国家、行业或领域标准与规范,必填项和选填项完整无缺。
基本达标(3分):元数据方案基本遵循标准与规范,但有个别次要偏离,必填项完整,选填项存在缺失。
不达标(0分):元数据方案严重偏离标准与规范,必填项缺失,或存在大量不规范项。
(注:必填项:标识符、资源名称、描述、关键词、注册日期、最新发布日期、学科分类、知识产权类别、资源访问地址。选填项:生成日期、主题分类、资源使用许可。)
(2)互操作性
完全达标(5分):核心必填元数据完整、准确,且关键推荐选填元数据也得到了充分、规范的填充。元数据为数据提供了丰富的上下文信息,最大程度地支持了自动化处理、跨平台集成和深度语义理解。
基本达标(3分):所有核心必填元数据均已提供且有效,满足了数据可发现、可识别、可访问、可重用的最低要求。但推荐选填项存在部分缺失或内容较为简略。
不达标(0分):一项或多项核心必填元数据缺失、无效或存在严重错误。
(注:必填项:必须全部完整且有效,包括:标识符、资源名称、描述、资源访问地址、最新发布日期、资源使用许可。选填项:关键词、学科分类、生成日期、知识产权类别、主题分类)
(3)安全性
完全达标(5分):元数据方案完整包含数据安全与隐私保护信息,明确标识敏感程度、访问权限、使用约束及个人隐私信息。
基本达标(3分):元数据方案基本包含安全信息,但部分细节缺失或标识不够清晰。
不达标(0分):元数据方案缺乏必要安全信息,或安全标识严重不足,存在隐私泄露风险。
2.元数据内容维度:
(1)唯一性
完全达标(5分):每个数据集和元数据项均具有唯一且稳定的标识符,标识符系统完整且无重复。
基本达标(3分):大多数数据集和元数据记录具有唯一标识符,但存在个别标识符不稳定或轻微重复。
不达标(0分):标识符缺失严重、不稳定或大量重复,无法确保唯一性。
(2)一致性
完全达标(5分):元数据记录内部及与数据实体之间完全一致,无任何逻辑矛盾或冲突。
基本达标(3分):主要字段格式与类型统一,个别非核心字段取值范围有差异,无关键逻辑矛盾。
不达标(0分):字段格式、类型混乱,取值范围冲突,存在明显逻辑矛盾,影响数据整合分析。
(3)准确性
完全达标(5分):元数据内容完全真实、无误地描述数据实体特征,无任何错误或误导信息。
基本达标(3分):元数据内容基本准确,但存在轻微错误或不精确描述,不影响整体理解。
不达标(0分):元数据内容存在严重错误或与数据实体不符,误导用户。
(4)完整性
完全达标(5分):元数据记录在首次汇交时所有必填项和选填项均填写,无空值;数据变化时及时更新,持续完整性高。
基本达标(3分):元数据记录基本完整,包含了所有必填项,但选填项有个别字段空值或更新延迟。
不达标(0分):元数据必填字段存在缺失,存在严重的逻辑错误,核心描述信息严重缺失。
(注:必填项:标识符、资源名称、描述、关键词、注册日期、最新发布日期、学科分类、知识产权类别、资源访问地址、资源使用许可。选填项:生成日期、主题分类。)
(5)可信性
完全达标(5分):元数据来源权威、过程透明、佐证信息充分(如论文、报告、代码库),完全可验证。
基本达标(3分):元数据来源基本可靠,过程描述较清晰,但佐证信息不足或部分验证困难。
不达标(0分):数据来源不明或不权威,描述信息无法验证,存在虚假、夸大内容。
(6)可用性
完全达标(5分):所有必填项内容准确、格式规范、信息有效;同时,关键选填项得到高质量填充。元数据描述精细、无歧义,用户能高效、准确地判断数据适用性并完成获取。
基本达标(3分):所有必填项已填写且基本有效,能满足最低限度的发现与获取需求,但部分内容质量一般或关键选填项缺失/不规范。用户需花费额外精力理解数据或确认获取细节。
不达标(0分):一项或多项核心必填项内容缺失、无效、错误或极度模糊,导致元数据无法支撑基本的数据检索与理解。
(注:必填项:标识符、资源名称、描述、注册日期、最新发布日期、资源访问地址、资源使用许可。选填项:关键词、学科分类、知识产权类别)
(7)易理解性
完全达标(5分):元数据内容使用清晰、无歧义的语言和术语,易于领域内外用户理解。
基本达标(3分):元数据内容基本清晰,但存在个别术语不规范或描述稍显模糊。
不达标(0分):元数据内容晦涩难懂,术语混乱,歧义严重,影响理解。
(8)可访问性
完全达标(5分):访问链接/标识符正确指向数据资源,受控访问流程通畅高效,无访问障碍。
基本达标(3分):访问链接基本正确,但受控访问流程稍有延迟或次要问题,不影响整体访问。
不达标(0分):元数据页面无法访问,或存在严重访问障碍,导致描述信息无法获取。
(9)可追溯性
完全达标(5分):数据汇交全流程记录完整(汇交人、时间、路径、修改记录),追溯链条清晰可查。
基本达标(3分):追溯记录基本完整,但个别细节缺失或查询不便,不影响整体追溯。
不达标(0分):未记录数据流转信息,无法追溯数据来源、修改历史及责任主体。
3.实体数据层面
(1)准确性
完全达标(5分):数据真实反映原始观测或采集结果,误差在允许范围内,关键字段经校验无错误。
基本达标(3分):数据基本准确,但存在轻微误差或个别字段未校验,不影响整体使用。
不达标(0分):数据存在严重错误或误差超限,关键字段未校验,影响数据可靠性。
(2)完整性
完全达标(5分):数据项、记录或文件无缺失,覆盖预期内容;二次使用时时空范围、主题覆盖、关键字段均达标。
基本达标(3分):数据基本完整,但有个别记录缺失或覆盖不足。
不达标(0分):数据缺失严重,或关键字段缺失,无法满足使用需求。
(3)规范性
完全达标(5分):数据存储格式、字段命名、类型标注完全符合预设标准或行业规范。
基本达标(3分):数据基本规范,但存在个别格式或命名不一致,不影响整体处理。
不达标(0分):数据格式、命名或标注严重不规范,阻碍数据处理与分析。
(4)一致性
完全达标(5分):数据内部及与其他数据集之间在单位、编码、时间上完全一致,无矛盾。
基本达标(3分):数据基本一致,但存在轻微单位或编码不匹配,不影响整体集成。
不达标(0分):数据内部存在明显逻辑矛盾,跨数据集冲突严重,影响分析结果可靠性。
(5)可获取性
完全达标(5分):数据实体能通过公开或受控方式顺利下载或访问,无技术障碍。
基本达标(3分):数据基本可获取,但偶尔存在访问延迟或次要问题。
不达标(0分):数据无法下载或访问,技术障碍严重。
(6)可用性
完全达标(5分):数据内容丰富、价值密度高,结构机器可读,互操作性强,理解与再现成本低。
基本达标(3分):数据需经过常规清洗、转换后可使用,不增加过多额外工作量。
不达标(0分):数据损坏、格式异常或无实际业务意义,无法用于任何应用场景。
4.合规层面
(1)伦理合规性
完全达标(5分):不涉及伦理或涉及伦理问题时,提供完整的伦理审批文件,批件内容与数据完全一致。
基本达标(3分):涉及伦理问题,并提供了伦理审批文件,但文件存在内容不完整、格式不规范,或与提交数据存在非原则性不一致等问题。
不达标(0分):涉及伦理问题时,未提供完整的伦理审批文件。
(2)人遗
完全达标(5分):不涉及人类遗传资源涉及人类遗传资源时,提供完整的国家审批文件,文件有效且与数据一致。
基本达标(3分):涉及人类遗传资源,但根据相关规定(如数量极少、属于豁免范围等),无需或暂不需提交国家审批文件,并已作出合理解释与声明。
不达标(0分):涉及人类遗传资源时,未提供完整的国家审批文件。
第三部分  专家的判断依据调查表

本部分旨在了解您对前述评价指标相关判断的依据来源,以客观评估专家意见的权威性与可靠性。请您根据实际情况,对各判断依据的影响程度进行选择。
您在对评价指标的重要性,评价标准的合理性进行判断时,主要依据哪些因素?请对以下各依据的影响程度进行评分
自身科研实践经验
相关领域学术文献
科学数据相关国家标准/行业规范
同行交流经验
所在单位/行业的实践案例
更多问卷 复制此问卷