准备您的数据集存款18bet官网中文

作为存款过程的一部分,我们将同意您数据的格式和结构以及切换日期。18bet官网中文确保您的数据是正确的,并且格式化将有助18bet官网中文于加快过程。

格式

18bet官网中文提供给EIDC的数据通常应以非专有格式(例如.csv而不是Excel工作簿)

我们维持A.可接受格式列表但是,列表并不穷,我们将在逐个案例的基础上考虑其他格式。

文件名

  • 尝试保持文件名短
  • 不要使用空格和特殊字符(例如$ * @%)
  • 只要有可能,文件名应该有意义并反映内容
  • 如果您有多个相关的文件,则是一个很好的想法,并使用相关的命名约定

例子

1486xiuytr.csv.
这并没有告诉我们任何关于数据的信息18bet官网中文

来自英国蝴蝶监测方案201118bet官网中文.csv的站点位置数据
这很长,包含空格

UKBMSLOCATION18bet官网中文DATA2011.csv.
这是描述性的,短暂的,不包含空格或特殊字符

变量

  • 变量名称应该是唯一的,短的和(最好)有意义的。
  • 避免变量名中的空格和特殊字符(例如$ * @ /,)。最佳实践是仅使用字母数字字符,下划线(_)和连字符( - )。
  • 删除对重新使用数据不重要的任何变量(例如,为管理员或内部目的创建)。18bet官网中文

例子

样本ID.
包含空间
sample_id.

个人栖息地的数量
包含空格,不必要地长
perch_count.

二项式/拉丁文_Name.
包含非标准字符(/)
binomial_name.

土壤温度°C
包含空格和非标准字符(°)
土壤_TEMP.

CodeLists和缩写

使用数据中的代码和缩写通常非常有用。18bet官网中文但是,如果您确实使用它们,必须确保:

  • 它们是唯一的(在数据集中)并一直使用18bet官网中文
  • 它们都在伴随的元数据中描述18bet官网中文
  • 您在元数据中提供的任何解释都适用。18bet官网中文例如,元数据状态“18bet官网中文t =跟踪“但代码T.实际上没有发生在数据中。18bet官网中文

缺少数据/空18bet官网中文

  • 优选识别空缺或丢失数据作为空白。18bet官网中文但是,根据数据的格式,这并不总是可能的。18bet官网中文识别空缺的替代方式是使用诸如NaN或N / A的代码。
  • 诸如-999999的数值也可以是可接受的,但如果可能,应该避免。
  • Zeros(0)永远不应用于识别空值为零是有意义的数据值。18bet官网中文
  • 无论您用于识别NULL的方法,它应该在整个数据集中一致地应用,并且必须在伴随的元数据中记录。18bet官网中文

表格数据18bet官网中文

结构

  • 我们通常希望用排列在列和行中排列的变量(质量,温度,浓18bet官网中文度等)格式化的表格数据。

标题

  • 变量名称应在第一行(和只要第一行)。18bet官网中文数据应在第2行中遵循。
  • 删除标题行中的多余信息。

一个坏csv的例证

好csv的例证

多个表

  • 切勿在单个电子表格中包含多个表。这使得机器更难以阅读数据。18bet官网中文
  • 每个表应分为其自己的文件。

一个坏csv的例证

匿名和数据安全性18bet官网中文

  • 确保数据是匿名的,在必要18bet官网中文的情况下,不能与任何可识别的人链接
  • 考虑匿名的网站位置数据,这是现场安全,设备或未来研究的必要条件18bet官网中文
  • 其中数据来自18bet官网中文现有数据,检查是否需要从数据所有者获得权限

质量

  • 转换存款数据时,请确保转换后所有18bet官网中文数据和元数据都是正确的
  • 确认数据详细信息与所规定的18bet官网中文访问和许可协议一致
  • 完成所有内部一致性检查,然后提供存款数据18bet官网中文
  • 解决任何数据问题并确保在18bet官网中文存款前完成数据,以最大限度地减少所需进一步存款的风险

如果您有任何疑问或不确定您的数据集的适用性进行存款,我们将乐意与您讨论。18bet官网中文请联系我们