跳转至

如何归档/整理项目文件

数据整理的必要性

为了能让接收项目的人,以及组里其他人的数据能够相互参考,避免不必要的重复计算和浪费。我与云霈总结了一些简单的整理规则。

数据整理的规则

规则1:

以项目名称命名大文件夹。例:SnO2110面的机器学习

SnO2110-ML #项目文件名

规则2:

以**数字**作为目录名前缀,以下**划线命名法**来给目录命名。

因为计算必定伴随着**目的**,所以目录名以计算的**目的**来命名。

**数字**可以使目录按照自己的意志来排序,**下划线命名法**可以有效的阅读。例:

./SnO2110-ML
├── 00.train_set #放训练集
├── 01.train_set_test #做训练集测试
├── 02.DP_Pots #放机器学习势能
├── 03.dissociation #计算解离度
├── 04.surface_tension #计算表面张力

注意:再次一级目录可不按照以上方法来命名,尽量使用**下划线命名法**即可。

规则3:

对于**作图类的目录**,要保留作图的**数据**,原始脚本**和**作出来的图。例:

01.train_set_test
├── TrainSetEnergy.pdf #作出来的图
├── TrainSetForce.png #作出来的图
├── TrainingSetError.py #处理作图的脚本 可以直接运行!
├── e.out #作图的原始数据
└── f.out #作图的原始数据

对于**计算类的目录**,要保留**必要的输出文件**和**输入文件**。例:

02.DP_Pots #放机器学习势能
├── v1.0 #版本号   ├── graph.000.pb #势能函数,输出文件的一种   ├── graph.001.pb
│   ├── graph.002.pb
│   ├── graph.003.pb
│   ├── input.000.json #对应的输入文件   ├── input.001.json
│   ├── input.002.json
│   └── input.003.json
├── v1.2
│   ├── graph.000.pb
│   ├── graph.001.pb
│   ├── graph.002.pb
│   ├── graph.003.pb
│   ├── input.000.json
│   ├── input.001.json
│   ├── input.002.json
│   └── input.003.json
└── v1.3
    ├── README
    ├── graph.000.pb
    ├── graph.001.pb
    ├── graph.002.pb
    └── graph.003.pb

规则4:

在文件夹里放入必要的说明文件,例如**README**

└── v1.3
    ├── README #必要的说明文件,推荐使用markdown语言书写
    ├── graph.000.pb
    ├── graph.001.pb
    ├── graph.002.pb
    └── graph.003.pb
# README
 converted from v1.2 pot
 compress input use that v1.2 training input

评论