㈠ 目前常用的手寫字體(數字,字母,漢字)數據集有哪些
1 cifar10資料庫
60000張32*32 彩色圖片 共10類
50000張訓練
10000張測試
下載cifar10資料庫
這是binary格式的,所以我們要把它轉換成leveldb格式。
2 在../caffe-windows/examples/cifar10文件夾中有一個 convert_cifar_data.cpp
將他include到MainCaller.cpp中。如下:
編譯....我是一次就通過了 ,在bin文件夾里出現convert_cifar_data.exe。然後 就可以進行格式轉換。binary→leveldb
可以在bin文件夾下新建一個input文件夾。將cifar10.binary文件放在input文件夾中,這樣轉換時就不用寫路徑了。
cmd進入bin文件夾
執行後,在output文件夾下有cifar_train_leveldb和cifar_test_leveldb兩個文件夾。裡面是轉化好的leveldb格式數據。
當然,也可以寫一個bat文件處理,方便以後再次使用。
3 下面我們要求數據圖像的均值
編譯../../tools/comput_image_mean.cpp
編譯成功後。接下來求mean
cmd進入bin。
執行後,在bin文件夾下出現一個mean.binaryproto文件,這就是所需的均值文件。
4 訓練cifar網路
在.../examples/cifar10文件夾里已經有網路的配置文件,我們只需要將cifar_train_leveldb和cifar_test_leveldb兩個文件夾還有mean.binaryproto文件拷到cifar0文件夾下。
修改cifar10_quick_train.prototxt中的source: "cifar-train-leveldb" mean_file: "mean.binaryproto" 和cifar10_quick_test.prototxt中的source: "cifar-test-leveldb"
mean_file: "mean.binaryproto"就可以了,
後面再訓練就類似於MNIST的訓練。寫一個train_quick.bat,內容如下:
[plain] view plain
..\\..\\bin\\MainCaller.exe ..\\..\\bin\\train_net.exe
SET GLOG_logtostderr=1
"../../bin/train_net.exe" cifar10_quick_solver.prototxt
pause