Mnist是什么意思

MNIST 是一個廣泛使用的機器學習數據集,用於訓練和測試圖像識別算法,特別是手寫數字的識別。它是「Modified National Institute of Standards and Technology」的縮寫,因為該數據集是基於美國國家標準與技術研究所(NIST)收集的數據集修改而來的。

MNIST 數據集包含 70,000 張圖像,其中每張圖像都是從 0 到 9 的單個手寫數字。這些圖像最初是從 250 張不同的手寫數字表單中提取出來的,這些表單是由不同的人書寫的。每個圖像都是 28x28 的灰度像素,因此可以看作是一個 784 維的向量。

MNIST 數據集被分為訓練集和測試集,其中訓練集包含 60,000 張圖像,而測試集包含 10,000 張圖像。此外,還有一個驗證集,它通常是從訓練集中分離出來的,用於調整模型的超參數。

MNIST 數據集因其簡單性和大小適中而被廣泛使用,特別適合作為機器學習入門的基準數據集。許多機器學習算法,如卷積神經網路(CNN)、支持向量機(SVM)和隨機森林等,都曾被用於解決 MNIST 數據集上的手寫數字識別問題。