Konvoluciaj neŭralaj retoj (CNNoj) unue estis dizajnitaj por la celo de bildrekono en la kampo de komputila vizio. Ĉi tiuj retoj estas specialeca speco de artefarita neŭrala reto, kiu pruvis esti tre efika en analizado de vidaj datumoj. La evoluo de CNN-oj estis movita per la bezono krei modelojn kiuj povis precize klasifiki kaj kategoriigi bildojn, kaj ilia sukceso en tiu domajno kondukis al ilia ĝeneraligita uzo en diversaj aliaj aplikoj kiel ekzemple objektodetekto, bildsegmentado, kaj eĉ naturlingva prilaborado.
CNN-oj estas inspiritaj de la strukturo kaj funkcieco de la vida kortekso en la homa cerbo. Kiel la vidkortekso, CNNoj konsistas el multoblaj tavoloj de interligitaj neŭronoj kiuj prilaboras malsamajn aspektojn de la enirdatenoj. La ŝlosila novigado de CNN-oj kuŝas en ilia kapablo aŭtomate lerni kaj ĉerpi koncernajn funkciojn el bildoj, forigante la bezonon de mana trajto-inĝenierado. Ĉi tio estas atingita per la uzo de konvoluciaj tavoloj, kiuj aplikas filtrilojn al la eniga bildo por detekti diversajn vidajn ŝablonojn kaj ecojn, kiel randoj, anguloj kaj teksturoj.
La unua sukceso en CNNoj venis kun la enkonduko de la LeNet-5-arkitekturo de Yann LeCun et al. en 1998. LeNet-5 estis specife dizajnita por manskribita ciferrekono kaj realigis rimarkindan efikecon sur la MNIST-datumserio, komparnorma datumaro vaste uzita por taksado de bildrekono-algoritmoj. LeNet-5 montris la potencon de CNN-oj en kaptado de hierarkiaj trajtoj de bildoj, ebligante precizan klasifikon eĉ en la ĉeesto de varioj en skalo, rotacio kaj tradukado.
Ekde tiam, CNNoj evoluis signife, kun pli profundaj kaj pli kompleksaj arkitekturoj estantaj evoluigitaj. Unu rimarkinda akcelo estis la enkonduko de la AlexNet-arkitekturo de Alex Krizhevsky et al. en 2012. AlexNet atingis sukceson en bildklasifiko gajnante la ImageNet Large Scale Visual Recognition Challenge (ILSVRC) kun signife pli malalta erarofteco komparite kun antaŭaj aliroj. Tiu sukceso pavimis laŭ la manieron por la ĝeneraligita adopto de CNNoj en bildrekonaj taskoj.
CNNoj ankaŭ estis sukcese aplikitaj al aliaj komputilvidaj taskoj. Ekzemple, en objektodetekto, CNNoj povas esti kombinitaj kun kromaj tavoloj por lokalizi kaj klasifiki objektojn ene de bildo. La fama Region-bazita Convolutional Neural Network (R-CNN) prezentita fare de Ross Girshick et al. en 2014 estas ekzemplo de tia arkitekturo. R-CNN atingis pintnivelajn rezultojn pri objektdetektokomparnormoj ekspluatante la potencon de CNN-oj por trajto-ekstraktado kaj kombinante ĝin kun regionproponmetodoj.
Konvoluciaj neŭralaj retoj unue estis dizajnitaj por bildrekonaj taskoj en la kampo de komputila vizio. Ili revoluciis la kampon aŭtomate lernante koncernajn funkciojn de bildoj, forigante la bezonon de manlibro-trajto-inĝenierado. La evoluo de CNN-oj kaŭzis signifajn akcelojn en bildklasifiko, objektodetekto, kaj diversaj aliaj komputilvidaj taskoj.
Aliaj lastatempaj demandoj kaj respondoj pri Altnivela Profunda Lernado de EITC/AI/ADL:
- Kial ni bezonas apliki optimumojn en maŝina lernado?
- Kiam okazas troagordado?
- Ĉu Konvoluciaj Neŭralaj Retoj povas pritrakti sinsekvajn datumojn per asimilado de konvolucioj laŭlonge de la tempo, kiel uzite en Konvoluciaj Sekvencaj al Sekvencaj modeloj?
- Ĉu Generative Adversarial Networks (GANoj) fidas je la ideo de generatoro kaj diskriminanto?