THỊ GIÁC MÁY 21-8-2025 CNN & RNN xe1 .pdf

khanhbg333 0 views 9 slides Sep 25, 2025
Slide 1
Slide 1 of 9
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9

About This Presentation

CNN & RNN thị giác máy


Slide Content

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 1
Họcsâulàmộtphươngpháphọcmáysửdụngcácmạngnơ-ronhọcsâu(DeepNeural
Networks)đểxửlýthôngtin.Mạngnơ-ronhọcsâuđượcxâydựngvớinhiềulớp,cáclớpliênkết
vớinhauđểtạothànhcácmôhìnhphứctạpcókhảnăngtiếpthuthôngtintừdữliệu.
Trongthịgiácmáy,DLđóngvaitròquantrọngtrongviệc“nhìn”vàodữliệuhìnhảnh.Nógiúp
máytínhxemxéttừngpixelcủahìnhảnhvàtạoracácdựđoánvềnhữnggìnó“thấy”.Mạngnơ-
ronsâuchạyquacáclớpvàkiểmtratínhchínhxáccủacácdựđoántrongmộtloạtcáclầnlặp
chođếnkhicácdựđoánbắtđầutrởthànhsựthật.Khiđómáytínhđãnhậndiệnhoặc“nhìn”vào
hìnhảnhmộtcáchtươngtựconngười.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 2
Cáccôngcụcủahọcsâuthườngsửdụngtrongthịgiácmáy:
Mạngnơ-rontíchchập(ConvolutionalNeuralNetwork-CNN):CNNphântíchdữliệuhình
ảnhthôngquahệthốnggánnhãn.
Mạngnơ-ronrồiquy(RecurrentNeuralNetwork-RNN):CNNthườngdùngđểphântích
nhữnghìnhảnhđơnlẻ,cònRNNdùngđểxửlýmộtloạthìnhảnhhoặcvideo.Tuynhiên,cách
thứchoạtđộngcũngtươngtựnhưCNN.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 3
Mạngnơ-rontíchchập(ConvolutionalNeuralNetwork-CNN):
CấutrúccơbảncủamộtmạngCNN:
-LớpInput:làhìnhảnhđầuvào,cóthểlàảnhmàuhoặcảnhđamức
xám.
-LớpConvolution:làlớpquantrọngnhấttrongCNN,đảmnhiệm
vaitròthựchiệncácphéptínhtíchchậpgiữamatrậnảnhđầuvàovà
matrậnlọcKernel/Filter/Mashvớinhằmmụcđíchtạobảnđồkíchhoạt/đặctrưngđểlàmđầuvàochocáclớpsau.
Nhữngyếutốquantrọngcủalớpnàybaogồmstride,padding,filtermap,vàfeaturemap.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 4
-LớpConvolution:Nhữngyếutốquantrọngcủalớpnàybaogồmstride,
padding,filtermap,vàfeaturemap.
•FilterMap:làcácbộlọcKernelđượcápdụnglêntừngvùngcủahìnhảnh.
•Stride:làbướcdịchchuyểncủafiltermaptrênhìnhảnh,dịchtừtráisangphải,
từtrênxuốngdướitheotừngpixeldựatrêngiátrịđãxácđịnh.
•Padding:làcácgiátrị0sẽđượcthêmvàolớpinputởviềnảnhđểgiữkíchthước
củaảnhkhôngbịthayđổi.
•FeatureMap:Saumỗilầnfiltermapquétquainput,quátrìnhtínhtoántíchchập
diễnra.Vàfeaturemap–bảnđồđặctrưngcủahìnhảnhbanđầuchínhlàkếtquả
củaquátrìnhnày.Càngnhiềubộlọcthìthuđượccàngnhiềuđặctrưngcủaảnh.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 5
CấutrúccơbảncủamộtmạngCNN:(tiếptheo)
-LớpPooling:Poolinglayergiúpgiảmkíchthướcđầuvàokhi
dữliệuquálớn.NóđượcđặtgiữacáclớpConvolutionallayerđể
giảmsốlượngthamsốcầntínhtoán.Cóhailoạiphổbiếnlàmax
poolingvàaveragepooling.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 6
-LớpPooling:Cóhailoạiphổbiếnlàmaxpoolingvàaveragepooling.
ChomatrậnảnhI=
i
11i
12i
13
i
21i
22i
23
i
31i
32i
33
,matrậnlọcH=
h
11h
12
h
21h
22
MatrậnkếtquảsauPooling:A=
a
11a
12
a
21a
22
Nếusửdụngmaxpoolingthì:
a
11=maxi
11h
11,i
12h
12,i
21h
21,i
22h
22
a
12=maxi
12h
11,i
13h
12,i
22h
21,i
23h
22
a
21=maxi
21h
11,i
22h
12,i
31h
21,i
32h
22
a
22=maxi
22h
11,i
23h
12,i
32h
21,i
33h
22
Nếusửdụngaveragepoolingthì:
a
11=
i
11h
11+i
12h
12+i
21h
21+i
22h
22
4
a
12=
i
12h
11+i
13h
12+i
22h
21+i
23h
22
4
a
21=
i
21h
11+i
22h
12+i
31h
21+i
32h
22
4
a
22=
i
22h
11+i
23h
12+i
32h
21+i
33h
22
4

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 7
CấutrúccơbảncủamộtmạngCNN:(tiếptheo)
-LớpFullyConnected:làlớpkếtnốiđầyđủnằmởcuốimạng
CNN,cóvaitròtổnghợptấtcảcácđặctrưngđãtríchxuấtvàthực
hiệnnhiệmvụphânloạihìnhảnh.Cácgiátrịtừfeaturemaptrước
đósẽđượcchuyểnthànhmộtvectormộtchiềuđểđưavàolớp
fullyconnectedđểxửlý.Tiếpđó,CNNsửdụngcáchàmkích
hoạtphituyếnnhưSoftmaxhoặcSigmoidđểtínhtoánxácsuất
chotừnglớpđầura.Điềunàygiúpchomôhìnhđưaraquyếtđịnh
cuốicùngởlớpOutput.

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 8
BÀI TẬP:
1.ỨngdụngMatlab/PythonthiếtkếmạngCNNđểnhậndạngđộngvậtgồm3loại:chó,mèovàgấu.
Gợiý:
Bước1:Chuẩnbịtậpdữliệuảnhdataset:cóthểdùngbộdữliệucósẵn(vídụnhư:MNIST(chữsố),
CIFAR-10(10loạihìnhảnh))hoặcdữliệuriêngtựthuthập.
Bước2:Tổchứcdữliệutheocấutrúcthưmục:thưmụcdữliệuảnhdùngđểtrain,thưmụcảnhdùng
đểxácthực(validation)môhìnhđãtrain,thưmụcảnhdùngđểtesthoặcảnhtestcóthểlấytừcamera.
Bước3:Tiềnxửlýdữliệutrên:resizeảnh,chuyểnsanggrayscale,chuẩnhóadữliệu(nếucần)

2. 3 HỌC SÂU TRONG THỊ GIÁC MÁY
TS. GVC LÊ THỊ THÚY NGA -UTC 9
BÀI TẬP:
1.ỨngdụngMatlab/PythonthiếtkếmạngCNNđểnhậndạngđộngvậtgồm3loại:chómèovàgấu.
Gợiý:
Bước4:Xâydựngmôhình:ChọncấutrúcmạngCNNcóbaonhiêulớpConvolution,pooling,activation,…
Bước5:Huấnluyệnmôhình:thờigianhuấnluyện,tốcđộhọc,…
Bước6:Đánhgiámôhìnhbằngcáchtínhtoáncácthôngsố:accuracy(độchínhxáctrêndữliệuthựctế),
val_accuracy(độchínhxáctrêndữliệuxácthực),…
Bước7:Dựđoánảnhmới
Tags