La arkitekturo de la neŭrala reto uzita en la ekzemplo estas plua neŭrala reto kun tri tavoloj: enirtavolo, kaŝita tavolo kaj produktaĵtavolo. La eniga tavolo konsistas el 784 unuoj, kio respondas al la nombro da pikseloj en la eniga bildo. Ĉiu unuo en la eniga tavolo reprezentas la intensecvaloron de pikselo en la bildo.
La kaŝita tavolo konsistas el 128 unuoj, kiuj estas plene konektitaj al la eniga tavolo. Ĉiu unuo en la kaŝita tavolo kalkulas laŭpezan sumon de la enigaĵoj de la enirtavolo kaj aplikas aktivigan funkcion por produkti produktaĵon. En ĉi tiu ekzemplo, la aktiviga funkcio uzita en la kaŝita tavolo estas la rektigita lineara unuo (ReLU) funkcio. La ReLU-funkcio estas difinita kiel f(x) = max(0, x), kie x estas la pezbalancita sumo de la enigaĵoj al la unuo. La ReLU-funkcio enkondukas ne-linearecon en la reto, permesante al ĝi lerni kompleksajn padronojn kaj rilatojn en la datenoj.
La produktaĵtavolo konsistas el 10 ekzempleroj, ĉiu reprezentante unu el la eblaj klasoj en la klasifikproblemo. La unuoj en la produktaĵtavolo ankaŭ estas plene konektitaj al la unuoj en la kaŝita tavolo. Simile al la kaŝita tavolo, ĉiu unuo en la produktaĵtavolo kalkulas pezbalancitan sumon de la enigaĵoj de la kaŝita tavolo kaj aplikas aktivigan funkcion. En ĉi tiu ekzemplo, la aktiviga funkcio uzita en la produktaĵtavolo estas la softmax-funkcio. La softmax-funkcio konvertas la laŭpezan sumon de enigaĵoj en probablodistribuon super la klasoj, kie la sumo de la verŝajnecoj estas egala al 1-a La unuo kun la plej alta probableco reprezentas la antaŭviditan klason de la enigbildo.
Por resumi, la neŭrala reto-arkitekturo uzita en la ekzemplo konsistas el eniga tavolo kun 784 ekzempleroj, kaŝita tavolo kun 128 ekzempleroj uzante la ReLU-aktivigan funkcion, kaj eligotavolon kun 10 ekzempleroj uzante la softmax-aktivigan funkcion.
Aliaj lastatempaj demandoj kaj respondoj pri Konstruante neŭralan reton por plenumi klasifikon:
- Ĉu necesas uzi nesinkronan lernan funkcion por maŝinlernado-modeloj, kiuj funkcias en TensorFlow.js?
- Kiel la modelo estas kompilita kaj trejnita en TensorFlow.js, kaj kia estas la rolo de la kategoria kruc-entropia perda funkcio?
- Kio estas la signifo de la lernoprocento kaj nombro da epokoj en la maŝinlernado?
- Kiel la trejnaj datumoj dividiĝas en trejnadon kaj testajn arojn en TensorFlow.js?
- Kio estas la celo de TensorFlow.js konstrui neŭralan reton por klasifikaj taskoj?