GEO数据库完全指南:从数据提交到高效检索的常见问题解答
本文全面解答了关于GEO(基因表达综合数据库)的常见问题,涵盖数据提交流程、时间节点、接受的数据类型、私有数据管理以及高效查询检索等关键操作指南,是科研人员使用这一重要生物信息学资源的必备参考。
什么是GEO?
基因表达综合数据库(Gene Expression Omnibus,简称GEO)是一个公共存储库,负责归档并免费分发由科学界提交的全面微阵列、下一代测序及其他形式的高通量功能基因组数据。除了数据存储功能外,GEO还提供一系列基于网络的界面和应用程序,帮助用户查询和下载存储在GEO中的研究及基因表达模式。如需了解更多关于GEO各个方面的信息,请查阅我们的文档列表和相关出版物。
数据提交相关问题
为何应将数据提交至GEO?
将数据提交至GEO有诸多益处。最可能的原因是您的研究资助方或计划发表论文的期刊要求将微阵列或测序数据存入符合MIAMEMinimum Information About a Microarray Experiment, a standard for reporting microarray data.或MINSEQEMinimum Information about a high-throughput Nucleotide SEQuencing Experiment, a standard for reporting sequencing data.标准的公共存储库(如GEO)。除了满足资助方和期刊的发表要求外,向GEO提交数据还有其他显著优势:您的数据将在集中式存储库中获得长期存档,并与NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.的其他资源集成,从而提升数据的可用性和可见性。您还可以在提交中包含指向您自己项目网站的链接,进一步提高您研究的曝光度。向GEO提交数据并不以期刊发表为前提。
如何向GEO提交数据?
提交者应首先通过其NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.账户登录。如果您没有NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.账户,可以在此处创建一个。随后,提交者需要填写“我的GEO个人资料”表格,提供联系方式,以便GEO策展人就提交事宜进行沟通,并在GEO记录中显示。所有提交者都需要以支持的提交格式提供原始数据、处理后的数据以及关于样本、实验方案和整体研究的描述性信息。请访问“提交数据”页面,根据您的数据类型点击相关链接以查找提交说明。高通量测序数据的提交者可以观看“如何提交至GEO”的教程视频。我们致力于使数据提交过程尽可能简单明了,并将提供您所需的任何帮助来完成数据提交。如果您在提交过程中遇到问题或有疑问,请通过电子邮件联系我们,我们的策展人会尽快回复您。
何时应向GEO提交数据?
许多期刊要求在论文被接受发表前提供微阵列或测序数据的登录号。此外,审稿人和编辑在审稿过程中可能需要访问您的数据。因此,应在将描述数据的稿件送交期刊评审之前,将数据存入GEO。GEO的处理时间通常在提交完成后约5个工作日左右,但在联邦假日期间可能需要更长时间,因此务必在需要稿件登录号之前提前提交。您的记录可以保持私有状态,直到您的稿件(或预印本)公开发布。一旦您的提交获得GEO工作人员批准,您就可以在稿件中引用GEO登录号,并可以生成审稿人访问令牌,供编辑和审稿人访问您的私有GEO记录。
数据何时会获得GEO登录号?
处理时间通常在提交完成后约5个工作日左右,但在联邦假日期间可能需要更长时间。您完成提交后,您的数据将进入队列等待策展人审核。请理解我们每周会收到数百项研究提交,处理时间可能因提交量而异。因此,务必在需要稿件登录号之前提前提交。如果您的提交在格式或内容上存在问题,策展人将通过电子邮件与您联系,说明如何解决问题。请务必处理策展人提出的问题;未能解决可能导致处理延迟或记录被移除。一旦您的记录通过审核,策展人将向您发送电子邮件,确认您的GEO登录号及其发布日期。如果您在提交后5个工作日内未收到我们的电子邮件,请首先检查您的垃圾邮件或垃圾邮件文件夹,因为某些系统可能将GEO的电子邮件通信识别为垃圾邮件,然后通过电子邮件向我们查询您的提交状态。在收到GEO策展人的批准电子邮件通知之前,请勿在稿件中引用GEO登录号。
GEO接受哪些类型的数据?
GEO的设计围绕当今使用的大多数高通量和并行分子丰度测量技术的共同特点。这包括由微阵列和高通量测序技术生成的数据,例如:
- 通过微阵列或下一代测序进行的基因表达谱分析(参见示例)
- 通过微阵列或下一代测序进行的非编码RNA谱分析(参见示例)
- 通过微阵列或下一代测序进行的染色质免疫沉淀(ChIPChromatin Immunoprecipitation, a technique used to investigate protein-DNA interactions in cells.)谱分析(参见示例)
- 通过微阵列或下一代测序进行的基因组甲基化谱分析(参见示例)
GEO是否存储原始数据?
是的,GEO要求提交原始数据文件。
我可以提交提取的或汇总的数据子集吗?
可以,但必须同时提交原始数据。
如何创建GEO账户?
通过NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.账户系统创建,与GEO共享登录凭证。
如何编辑我的联系信息?
登录NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.账户,在个人资料设置中更新。
我运营一个设施,需要为多位研究者提交数据。应该使用哪个账户?
建议使用机构通用账户或主要研究者的账户,并在提交中明确列出所有贡献者。
在准备稿件或审稿期间,我可以保持数据私有吗?
可以,GEO支持私有状态,直到稿件发表。
稿件发表后,我可以保持数据私有吗?
不可以,发表后数据必须公开,这是大多数资助机构和期刊的要求。
如何允许审稿人访问我的私有记录?
通过生成审稿人访问令牌,与审稿人共享。
如何更正已提交的数据?
联系GEO策展人,说明需要更正的内容。
如何删除我的记录?
一般情况下不建议删除,如有特殊原因需联系GEO工作人员。
我是审稿人,如何访问和评估预发表数据?
通过作者提供的审稿人访问令牌链接访问。
GEO是否支持MIAMEMinimum Information About a Microarray Experiment, a standard for reporting microarray data.和MINSEQEMinimum Information about a high-throughput Nucleotide SEQuencing Experiment, a standard for reporting sequencing data.标准?
是的,GEO完全支持这些标准。
人类受试者指南:我可以提交来自人类受试者的数据吗?
可以,但必须遵守相关伦理规定和隐私保护要求。
查询与检索相关问题
谁可以使用GEO数据?
GEO数据对全球科研人员免费开放。
GEO支持哪些类型的检索?
支持按登录号、关键词、物种、平台类型等多种方式检索。
如何查询和分析GEO数据?
通过GEO网站提供的查询工具和分析应用程序。
可以通过编程方式访问GEO数据吗?
是的,GEO提供API接口供程序化访问。
当有新数据可用时,我能收到通知吗?
可以,通过订阅RSS源或设置电子邮件提醒。
我可以引用在GEO中找到的数据作为我自己研究的证据吗?
可以,但必须正确引用数据来源。
Series和DataSet有什么区别?
Series代表整个研究,DataSet代表研究中的特定数据子集。
为什么我找不到感兴趣研究的基因谱图或聚类?
可能是数据尚未处理或该研究不支持这些可视化。
GEO谱图中的红色条和蓝色方块代表什么?
红色条表示表达上调,蓝色方块表示表达下调。
下一代测序提交提供哪些数据类型?
包括原始测序文件、比对文件和表达量化文件等。
Data Analysis
| 主题 | 关键问题/要点 | 解答/说明 |
|---|---|---|
| 数据提交 | 为何提交数据? | 满足资助方/期刊要求(MIAMEMinimum Information About a Microarray Experiment, a standard for reporting microarray data./MINSEQEMinimum Information about a high-throughput Nucleotide SEQuencing Experiment, a standard for reporting sequencing data.标准),长期存档,提升数据可见性与可用性。 |
| 何时提交数据? | 在稿件送审前提交。处理时间约5个工作日,建议提前规划。 | |
| 数据状态 | 提交后可保持私有,稿件发表后必须公开。 | |
| 审稿人访问 | 可通过生成“审稿人访问令牌”共享私有数据。 | |
| 数据类型与标准 | 接受的数据类型 | 微阵列与高通量测序数据,如基因表达谱、非编码RNA谱、ChIPChromatin Immunoprecipitation, a technique used to investigate protein-DNA interactions in cells.谱、甲基化谱等。 |
| 原始数据要求 | 必须提交原始数据,可同时提交处理后的数据子集。 | |
| 支持的标准 | 完全支持MIAMEMinimum Information About a Microarray Experiment, a standard for reporting microarray data.和MINSEQEMinimum Information about a high-throughput Nucleotide SEQuencing Experiment, a standard for reporting sequencing data.标准。 | |
| 账户与管理 | 如何创建/登录账户? | 使用NCBIThe National Center for Biotechnology Information, a US organization that maintains biological databases including GEO.账户(与GEO共享凭证)。 |
| 多研究者提交 | 建议使用机构通用账户或主要研究者账户,并明确列出所有贡献者。 | |
| 数据更正或删除 | 联系GEO策展人进行更正;一般不推荐删除记录。 | |
| 查询与检索 | 数据访问权限 | 全球科研人员免费使用。 |
| 检索方式 | 支持按登录号、关键词、物种、平台类型等多种方式检索。 | |
| 程序化访问 | 提供API接口供编程访问。 | |
| 数据更新通知 | 可通过订阅RSS源或设置电子邮件提醒获取。 | |
| 术语与可视化 | Series vs. DataSet | Series代表整个研究;DataSet代表研究中的特定数据子集。 |
| 谱图颜色含义 | 红色条表示表达上调;蓝色方块表示表达下调。 |
Source/Note: 本表根据提供的《GEO数据库完全指南》文本内容综合整理而成。
版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。
文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。
若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。