如何归档/整理项目文件¶

数据整理的必要性¶

为了能让接收项目的人，以及组里其他人的数据能够相互参考，避免不必要的重复计算和浪费。我与云霈总结了一些简单的整理规则。

数据整理的规则¶

规则1:¶

以项目名称命名大文件夹。例：SnO2110面的机器学习

SnO2110-ML #项目文件名

规则2:¶

以数字作为目录名前缀，以下 划线命名法 来给目录命名。

因为计算必定伴随着目的，所以目录名以计算的目的来命名。

数字可以使目录按照自己的意志来排序， 下划线命名法 可以有效的阅读。例：

./SnO2110-ML
├── 00.train_set #放训练集
├── 01.train_set_test #做训练集测试
├── 02.DP_Pots #放机器学习势能
├── 03.dissociation #计算解离度
├── 04.surface_tension #计算表面张力

注意：再次一级目录可不按照以上方法来命名，尽量使用 下划线命名法 即可。

规则3:¶

对于 作图类的目录，要保留作图的数据，原始脚本 和 作出来的图。例：

01.train_set_test
├── TrainSetEnergy.pdf #作出来的图
├── TrainSetForce.png #作出来的图
├── TrainingSetError.py #处理作图的脚本 可以直接运行！
├── e.out #作图的原始数据
└── f.out #作图的原始数据

对于 计算类的目录，要保留 必要的输出文件 和 输入文件。例：

02.DP_Pots #放机器学习势能
├── v1.0 #版本号
│   ├── graph.000.pb #势能函数，输出文件的一种
│   ├── graph.001.pb
│   ├── graph.002.pb
│   ├── graph.003.pb
│   ├── input.000.json #对应的输入文件
│   ├── input.001.json
│   ├── input.002.json
│   └── input.003.json
├── v1.2
│   ├── graph.000.pb
│   ├── graph.001.pb
│   ├── graph.002.pb
│   ├── graph.003.pb
│   ├── input.000.json
│   ├── input.001.json
│   ├── input.002.json
│   └── input.003.json
└── v1.3
    ├── README
    ├── graph.000.pb
    ├── graph.001.pb
    ├── graph.002.pb
    └── graph.003.pb

规则4:¶

在文件夹里放入必要的说明文件，例如 README

└── v1.3
    ├── README #必要的说明文件，推荐使用markdown语言书写
    ├── graph.000.pb
    ├── graph.001.pb
    ├── graph.002.pb
    └── graph.003.pb

# README
 converted from v1.2 pot
 compress input use that v1.2 training input