A. 數據模型需要多少訓練數據
選擇合適的演算法之外還需要選擇合適的樣本數據。那麼工程師到底應該選擇哪些樣本數據、選擇多少樣本數據才最合適呢?來自於Google的軟體工程師Malay Haldar最近發表了一篇題為《數據模型需要多少訓練數據》的文章對此進行了介紹。
訓練數據的質量和數量通常是決定一個模型性能的最關鍵因素。一旦訓練數據准備好,其他的事情就順理成章了。但是到底應該准備多少訓練數據呢?答案是這取決於要執行的任務,要滿足的性能,所擁有的輸入特徵、訓練數據中的噪音、提取特徵中的噪音以及模型的復雜程度等因素。而找出這些變數之間相互關系的方法就是在不同數據量的訓練數據上訓練模型並繪制學習曲線。但是這僅僅適合於已經有一定數量的訓練數據的情況,如果是最開始的時候,或者說只有很少一點訓練數據的情況,那應該怎麼辦呢?
與死板地給出所謂精確的「正確」答案相比,更靠譜的方法是通過估算
B. 建模需要什麼數據
井名、層名、頂深、底深 分層數據
2.
井點斷點解釋數據 這幾項屬於井點信息,並要 明確是陸地上的井,還是海 上的井,涉及到補心問題。 數據的文件格式都為 txt。 深度建議為 MD 或 TVD 測井曲線 Las、ASCII