FASHION MNIST IMAGE RECOGNITION BY DEEP LEARNING METHODS
DOI:
https://doi.org/10.32782/KNTU2618-0340/2021.4.1.8Анотація
A review of modern methods for recognizing image objects has shown that deep learning algorithms are successfully used and provide high quality. An example is the quality of character recognition of the MNIST set, which is close to 100%. For another dataset, which is also popular in the implementation of deep learning algorithms, namely, the Fashion MNIST set of clothing items and accessories, such a high recognition quality has not yet been achieved.
The paper presents the results of data recognition Fashion MNISТ.
Models of a feedforward neural network and convolutional network are considered.
The software implementation of deep learning algorithms is carried out, namely, a multilayer feedforward network (FNN) and a convolutional neural network (CNN) are considered. The Python language, the TensorFlow and Keras libraries are used. The Keras library allows you to simplify TensorFlow function calls. A typical workflow in Python Keras is as follows: loading the necessary modules, loading data, preprocessing, breaking them into training, test and validation parts; creating a model with an indication of the architecture, and more.
A numerical experiment was carried out to recognize clothing items by means of FNN. Automatic tuning of network hyperparameters has been performed. The recognition quality on test data is 0.89. The hyperparameter tuning did not significantly improve the quality. The low quality of recognition is also explained by the use of a very simple neural network model. Improved results have been achieved using convolutional neural networks. The best recognition results obtained in the work is 91.26%, but the known best recognition quality result is 94%.
It is advisable to continue the work on improving the results of recognition of images of Fashion MNIST data, and the software that has been developed can be used to recognize other data.
With a creative approach to image object recognition in Python using the Keras Tensorflow libraries and others, it is a very promising direction for practical application.
Огляд сучасних методів розпізнавання об’єктів-зображень показав, що алгоритми глибокого навчання успішно використовуються і дозволяють отримати високу якість. Прикладом можливо привести якість розпізнавання символів набору MNIST, яка наблизилась до 100%. Для другого набору даних, який теж популярний при тестуванні алгоритмів глибокого навчання, а саме, набору елементів одягу та аксесуарів Fashion MNIST, така висока якість розпізнавання ще не отримана.
У роботі представлені результати розпізнавання даних Fashion MNISТ.
Розглянуті моделі нейронної мережі прямого поширення і згорткової мережі.
Виконано програмну реалізацію алгоритмів глибокого навчання, а саме, розглянуто багатошарову мережу прямого поширення (FNN) та згорткову нейронну мережу (CNN). Використано мову Python, бібліотеки TensorFlow та Keras Бібліотека Keras дозволяє спрощувати виклики функцій з TensorFlow. Типовий процес роботи в Python Keras полягає в наступному: завантаження необхідних модулів, завантаження даних, попередня обробка, розбивка їх на навчальну, тестову і валідаційну частини; створення моделі із зазначенням архітектури, та інше. Розроблено модуль для перегляду зображень набору даних, параметрів мережі та інформації з якості розпізнавання.
Виконано чисельний експеримент розпізнавання елементів одягу засобами FNN. Проведено автоматичне налаштування гіперпараметрів мережі. Якість розпізнавання на тестових даних дорівнює 0,89. Налаштування гіперпараметрів покращило якість несуттєво. Невисока якість розпізнавання пояснюється також використанням дуже простої моделі нейронної мережі. Поліпшення результатів було досягнуто з використанням згорткової нейронної мережі. Кращій результати розпізнавання, який отримано у роботі, дорівнює 91.26%, але відомий найкращий результат якості розпізнавання дорівнює 94%.
Роботу з вдосконалення результатів розпізнавання зображень даних Fashion MNIST доцільно продовжити, а програмний засіб, який розроблено, можливо використовувати щодо розпізнавання інших даних.
При творчому підході розпізнавання об'єктів зображень на Python з застосуванням бібліотек Keras Tensorflow і інших є дуже перспективним напрямком для практичного застосування.
Посилання
Digit Recognizer [Elektronnyi resurs] – Rezhym dostupu. — URL: https://www.kaggle.com/c/digit-recognizer
To Serious Machine Learning Researchers [Elektronnyi resurs] – Rezhym dostupu. — URL: https://github.com/zalandoresearch/fashion-mnist.
Shivam, S. Kadam, Amol, C. Adamuthe & Ashwini, B. Patil. CNN Model for Image Classification on MNIST and Fashion-MNIST Dataset. Journal of Scientific Research 64(02):374-384. DOI:10.37398/JSR.2020.640251– Rezhym dostupu. — URL: https://www.researchgate.net/publication/343173734
Digit Recognizer [Elektronnyi resurs] – Rezhym dostupu. — URL. https://www.kaggle.com/zalando-research/fashionmnist
Gudfellou, Ya., Bendzhio, I. & Kurvill, A. (2018). Glubokoe obuchenie/per. s ang. Slinkina A. A. 2-e izd., ispr. M.: DMK Press.
Nikolenko, S., Kadurin, A. & Arhangelskaya, E. (2018). Glubokoe obuchenie. SPb.: Piter.
Antonio, Dzhulli & Sudzhit, Pal. (2018). Biblioteka Keras – instrument glubokogo obucheniya. Realizatsiya neyronnyih setey s pomoschyu bibliotek Theano i TensorFlow/Per. s angl.Slinkin A. A. M.: DMK Press.
Zheron, Orelen. (2018). Prikladnoe mashinnoe obuchenie s pomoschyu Scikit-Learn i TensorFlow: kontseptsii, instrumentyi i tehniki dlya sozdaniya intellektualnyih sistem./Per. s angl. SPb.: OOO "Alfa-kniga.
Plas, Dzh. Vander. (2018). Python dlya slozhnyih zadach: nauka o dannyih i mashinnoe obuchenie. SPb.: Piter.
Lutts, M. (2011). Programmirovanie na Python, tom I, 4-e izdanie. / Per. s angl. SPb.: Simvol-Plyus.