RESEARCH OF IMAGE THEORY: SETS OF POINTS AND OPERATIONS ON THEM
DOI:
https://doi.org/10.32782/KNTU2618-0340/2021.4.2.1.10Анотація
For decades, pattern recognition and image processing, in particular, has remained an urgent task. Today we have a well-developed theoretical foundation of basic concepts, operations and the need to formalize the input (initial) information, which allows the effective application of the theory of recognition. To solve the problem, the first step is to review the concepts and operations of image algebra. The formalism associated with the construction of the architecture of the image processing system is that the attributes of the pixel can be described at the boundary of arithmetic and mathematical morphology. The paper succinctly considers the algebraic representation of sets of points and operations on them for unified application in further work with images; including a) synchronization of Ukrainian-English equivalents; b) providing a representation of the continuity of the reflection of the space of points using a mathematical apparatus for further research. Algebraic theory presents the language of images as a properly implemented standard of image processing, which can significantly reduce the effort to study and develop problems related to computer vision. Since the basis of this language is purely mathematical and does not depend on the future computer architecture or programming language, the effectiveness of this approach in developing and teaching students to adapt algebraic image theory as a standard environment for image processing is undeniable. Additional advantages of algebraic image theory are: the operations of elementary algebra are small in number, simple, and provide an opportunity to present a method of transforming images in an easily digestible form; algebraic operations and operands provide the ability to express all image-to-image transformations; theorems governing algebra and computer programs based on notation are subject to both machine-dependent and machine-independent optimization techniques; algebraic representation provides a deeper understanding of the manipulation of operations on the image through the brevity of the description (method of writing / perception), which makes visible the optimal solutions; notational adaptability to programming languages allows the substitution of extremely short and concise algebraic expressions for equivalent blocks of code, and therefore increases the productivity of the programmer; algebra provides a rich mathematical structure that can be exploited by linking image processing problems with other mathematical areas; without an algebraic representation of the solution, the programmer will never benefit from the bridge that exists between the programming language and the variety of mathematical structures, theorems, and identities associated with mathematical theory; there are no competing designations that adequately provide all these advantages.
Впродовж десятиліть розпізнавання образів і опрацювання зображень, зокрема, залишається актуальною задачею. На сьогодні ми маємо добре пророблений теоретичний фундамент базових понять, операцій і потребу формалізації вхідної (початкової) інформації, що допускає ефективне застосування теорії розпізнавання. Для розв’язку задачі, першим кроком, проведемо огляд понять та операцій алгебри зображень. Формалізм пов'язаний з побудовою архітектури системи обробки зображення полягає в тому, що атрибути пікселя можуть бути описані на межі арифметики і математичної морфології. У роботі лаконічно розглянуто алгебраїчне представлення множин точок і операцій над ними для уніфікованого застосування при подальшій роботі із зображеннями, включаючи а) синхронізацію українсько-англійських відповідників; б) забезпечення представлення неперервності відображення простору точок за допомогою математичного апарату для подальших досліджень. Алгебраїчна теорія представляє мову зображень як належним чином реалізований стандарт обробки зображень, що може значно зменшити зусилля для вивчення та розвитку проблем, пов'язаних з комп'ютерним зором. Оскільки, основа цієї мови суто математична і не залежить від майбутньої архітектури комп’ютера чи мови програмування, то ефективність цього підходу у розробці та навчанні студентів адаптувати алгебраїчну теорію зображень як стандартне середовище для обробки зображень є незаперечною. Додатковими перевагами алгебричної теорії зображень є: операції з елементарною алгеброю – невеликі за кількістю, прості і дають можливість представити метод перетворення зображень у легкозасвоюваній формі; алгебраїчні операції та операнди забезпечують можливість виразити всі перетворення зображення в зображення; теореми, що регулюють алгебру та комп’ютерні програми, засновані на позначеннях, підпорядковуються як машинно-залежним, так і машинно-незалежним методам оптимізації; алгебраїчне подання забезпечує більш глибоке розуміння маніпуляцій з операціями над зображенням через стислість опису (метод написання / сприйняття), що робить видимими оптимальні рішення; адаптованість до мов програмування дозволяє замінити надзвичайно короткі та стислі алгебраїчні вирази еквівалентними блоками коду, а отже, збільшує продуктивність програміста; алгебра забезпечує містку математичну структуру, яку можна використовувати, пов’язуючи проблеми обробки зображень з іншими математичними областями; без алгебраїчного подання рішення програміст ніколи не виграє від містка, що існує між мовою програмування та різноманітністю математичних структур, теорем та тотожностей, пов’язаних з математичною теорією; немає конкуруючих позначень, які б адекватно забезпечували всі ці переваги.
Посилання
Unger, S. (1958). A computer oriented toward spatial problems. Proceedings of the IRE. Vol. 46, 1144–1750.
G.X. Ritter, “Recent developments in image algebra,” inAdvances in Electronics and Electron Physics, vol. 80, Academic Press, New York, 1991, pp. 243–308.
Cutting-edge facial recognition goes mainstream. Reasearch*eu results magazine. December 2017-January 2018, p. 68.
Minkowski, H. (1911). Gesammelte Abhandlungen. Leipzig-Berlin: Teubner Verlag.
Hadwiger, H. (1957). Vorlesungen U¨ ber Inhalt, Oberflæche und Isoperimetrie. Berlin: Springer-Verlag.
Matheron, G. (1975). Random Sets and Integral Geometry. New York: Wiley.
Serra, J. (1969). Introduction a la morphologie mathematique. Booklet no. 3. Cahiers du Centre de Morphologie Mathematique, Fontainebleau, France.
Serra, J. (1975). Morphologie pour les fonctions a peu pres en tout ou rien. Technical report. Cahiers du Centre de Morphologie Mathematique, Fontainebleau, France.
Serra, J. (1982). Image Analysis and Mathematical Morphology. London: Academic Press.
Crimmins, T., & Brown, W. (1985). Image algebra and automatic shape recognition. IEEE Transactions on Aerospace and Electronic Systems. Jan. Vol. AES-21, 60–69.
Haralick, R., Sternberg, S., & Zhuang, X. (1987). Image analysis using mathematical morphology: Part I. IEEE Transactions on Pattern Analysis and Machine Intelligence. July. Vol. 9, 532–550.
Haralick, R., Shapiro, L., & Lee, J. (1987). Morphological edge detection. IEEE Journal of Robotics and Automation. Apr. Vol. RA-3, 142–157.
Maragos, P., & Schafer, R. (1986). Morphological skeleton representation and coding of binary images. IEEE Transactions on Acoustics, Speech, and Signal Processing. Oct.
Vol. ASSP-34, 1228–1244.
Maragos, P., & Schafer, R. (1987). Morphological filters Part II : Their relations to median, order-statistic, and stack filters. IEEE Transactions on Acoustics, Speech, and Signal Processing. Aug. Vol. ASSP-35, 1170–1184.
Maragos, P., & Schafer, R. (1987). Morphological filters Part I: Their set-theoretic analysis and relations to linear shift-invariant filters. IEEE Transactions on Acoustics, Speech, and Signal Processing. Aug. Vol. ASSP-35, 1153–1169.
Davidson, J., & Talukder, A. (1993). Template identification using simulated annealing in morphology neural networks. Second Annual Midwest Electro-Technology Conference. (Ames, IA). IEEE Central Iowa Section. Apr., pp. 64–67.
Davidson, J., & Hummer, F. (1993). Morphology neural networks: An introduction with applications. IEEE Systems Signal Processing. Vol. 12, no. 2, 177–210.
Dougherty, E. (1992). Unification of nonlinear filtering in the context of binary logical calculus, part ii: Gray-scale filters. Journal of Mathematical Imaging and Vision. Nov. Vol. 2, 185–192.
Schonfeld, D., & Goutsias, J. (1991). Optimal morphological pattern restoration from noisy binary images. IEEE Transactions on Pattern Analysis and Machine Intelligence. Jan. Vol. 13, 14–29.
Goutsias, J. (1992). On the morphological analysis of discrete random shapes. Journal of Mathematical Imaging and Vision. Nov. Vol. 2, 193–216.
Koskinen, L., & Astola, J. (1992). Asymptotic behaviour of morphological filters. Journal of Mathematical Imaging and Vision. Nov. Vol. 2, 117–136.
Sternberg, S. R. (1980). Language and architecture for parallel image processing. Proceedings of the Conference on Pattern Recognition in Practice. (Amsterdam). May.
Sternberg, S. (1985). Overview of image algebra and related issues. Integrated Technology for Parallel Image Processing. (S. Levialdi, ed.), London: Academic Press.
Davidson, J. (1989). Lattice Structures in the Image Algebra and Applications to Image Processing. PhD thesis, University of Florida, Gainesville, FL.
Hrytsyk, V., Grondzal A., & Bilenkyj A. (2015). Augmented Reality for People with Disabilities. Proceedings of the International Conference on Computer Sciences and Information Technologies, CSIT’2015 (Lviv, 2015, September 14–17). Lviv: Polytechnic National University, pp. 188–191.
Cutting-edge facial recognition goes mainstream. Reasearch*eu results magazine. December 2017-January 2018. No. 68. P. 39.