健康和特质白皮书

1. 简介

不同个体之间约有 99% 的基因组 DNA 序列是相同的，因此人与人之间的差异仅归结于这 1% 的微小不同（不包括表观遗传学），而这 1% 的差别主要是单核苷酸多态性(SNP)。对 SNP 分析有助于解释个体遗传特质、不同群体和个体对疾病，特别是对复杂疾病的易感性、药物的耐受性等方面的差异。

目前 SNP 研究成果已被广泛应用于分子诊断、临床检验、遗传疾病和新药研发等领域。基于这些研究，基因宝开发了健康风险评估和遗传特质板块的检测服务。

2. 使用说明

检测方法使用的是基因芯片技术；

表型是由基因、环境以及生活方式等共同作用决定的，基因只占到了其中的一部分，因此会出现不符合现状的情况；

检测结果中出现的任何“高于 XX%”或类似描述，并不代表一定有风险；

检测结果会随着用户增多和科学研究进步而不断迭代和优化；

检测项目会随着指南的更新和研究取得新进展而不断增加。

3. 项目选择标准

健康风险评估和遗传特质的项目主要来自各大学术搜索平台，如 Pubmed、Google Scholar、Wiley Online Library、ResearchGate、bioRxiv，和权威期刊如 Nature 及其子刊、Science 及其子刊、Cell Press 系列期刊、Lacent 及其子刊、JAMA 及其子刊、NEJM、PANS、CA 等，以及专业的生物信息数据库 GWAS Catalog、HapMap、HGMD 等。

1) 健康风险评估

健康风险评估板块旨在通过易感基因的携带筛查，帮助用户通过后天的生活习惯的改变来规避疾病的风险。所以，在项目选择上需遵循以下标准之一：

头部期刊的最新的研究成果；

取得突破性进展的研究成果；

研究人群需含有东亚和中国人群；

多中心、大样本量的研究成果；

用户较为常见和容易理解的研究成果；

全基因组关联分析研究(GWAS)。

2) 遗传特质

遗传特质板块旨在对功能较为明确的基因进行检测后，帮助用户了解自身某些特征的由来。所以，在项目选择上需遵循以下标准之一：

医疗机构或 CFDA 等相关国家机构有建议辅助诊断检测的项目；

有生理功能验证的研究成果；

在中国人群中得到验证的研究成果；

用户自我感知能力较强的研究成果。

4. 位点确认标准

健康风险评估和遗传特质位点确认标准不同，需要进行分开介绍。

1) 健康风险评估

研究样本为中国人群或东亚人群的位点；

两篇及以上的独立文献支持的位点；

P值 < 5 * 10^-8 的位点；

没有连锁不平衡效应的位点；

在芯片检测范围内的位点；

频率不能为 1 的位点。

2) 遗传特质

在中国人群中有验证的位点；

有生理功能验证的位点；

频率不能为 1 的位点；

可以 Impute 的位点。

5. 使用算法说明

目前广泛使用的算法是多基因风险评分(Polygenic Risk Scores)，PRS也在众多研究中表现出较高的预测能力。基因宝的遗传咨询师会根据各研究中的效应值，给位点附上不同的权重，从而得到预测结果。

这一算法的介绍如下：

Wand, H. et al. Improving reporting standards for polygenic scores in risk prediction studies. Nature 591, 211–219 (2021).

Choi, S. W., Mak, T. S.-H. & O’Reilly, P. F. Tutorial: a guide to performing polygenic risk score analyses. Nat Protoc 15, 2759–2772 (2020).

6. 检测过程

具体内容详见实验流程白皮书。

7. 性能验证

重复性验证

为了确保检测平台的精确性，因此需要选择不同实验员在不同时间使用不同批次的芯片对同一样本进行重复实验，以此确保实验的精确性。

首先对 100 个标准品进行 Sanger 测序，然后分别选择 3 组实验人员在不同时间选择不同批次的芯片进行 3 次基因分型实验，并将基因分型的结果与 Sanger 测序结果进行对比。结果发现，基因芯片最低的精确性为 99.5%，最高达到 99.9%，平均精确性> 99.6%，能够确保检测平台的精确性，满足用遗传变异筛查板块检测的需求。

准确性验证

同一样本的 DNA 序列在理论上是完全一致的，但由于实验存在一定的随机误差和系统误差，因此需要验证误差是否会对检测结果准确性产生影响。

基因宝选取 100 个标准品首先进行 Sanger 测序，然后将 Sanger 测序结果与芯片测序结果进行对比，结果表明，Sanger 测序结果与基因宝芯片检测结果一致率> 99.9%。

注意：生物实验由于要求很高，因此存在一定的失败率，根据目前统计结果，实验失败率< 1%，失败的主要原因归因于样本质量不合格。

8. 检测局限性说明

检测结果可能未覆盖所有与该表型有关的遗传变异；

表型是由基因、环境以及生活方式等共同作用决定的，基因只占到了其中的一部分，因此会出现不符合现状的情况；

检测结果可能会随着科学研究进步而不断迭代和优化；

本检测仅针对人类基因组上的单核苷酸多态性位点进行检测，不包含拷贝数变异，染色质/染色体结构核型异常，基因表达异常，表观遗传异常等在内的任何非单核苷酸多态性的遗传变异。

9. 参考文献

Wand, H. et al. Improving reporting standards for polygenic scores in risk prediction studies. Nature 591, 211–219 (2021).

Choi, S. W., Mak, T. S.-H. & O’Reilly, P. F. Tutorial: a guide to performing polygenic risk score analyses. Nat Protoc 15, 2759–2772 (2020).

https://www.sciencemag.org/

https://www.nature.com/

https://www.sciencedirect.com/journal/the-lancet

https://jamanetwork.com/journals/jama

https://www.nejm.org/

https://www.ebi.ac.uk/gwas/

https://pubmed.ncbi.nlm.nih.gov/