Cnn Là Gì

Bài này sẽ reviews về convolutional neural network, sẽ tiến hành dùng Lúc đầu vào của neural network là ảnh. Mọi tín đồ bắt buộc gọi trước bài xích neural network với xử lý ảnh trước khi bước đầu bài này.

Bạn đang xem: Cnn là gì


Thiết lập bài toán

Gần phía trên câu hỏi chất vấn mã captthân phụ nhằm xác minch chưa phải robot của google bị chủ yếu robot thừa qua


*
Mô hình neural network.

Mỗi hidden layer được Call là fully connected layer, tên gọi theo đúng ý nghĩa sâu sắc, mỗi node vào hidden layer được liên kết với tất cả các node vào layer trước. Cả quy mô được Hotline là fully connected neural network (FCN).

Vấn đề của fully connected neural network với xử lý ảnh

Nlỗi bài bác trước về giải pháp xử lý hình họa, thì hình ảnh màu sắc 64*64 được biểu diễn dưới dạng 1 tensor 64*64*3. Nên để thể hiện hết văn bản của bức ảnh thì nên cần truyền vào đầu vào layer tất cả các px (64*64*3 = 12288). Nghĩa là input đầu vào layer giờ gồm 12288 nodes.


*

Tuy nhiên ảnh màu có tới 3 channels red, green, blue nên khi màn trình diễn hình họa bên dưới dạng tensor 3D. Nên ta cũng trở nên tư tưởng kernel là 1 trong những tensor 3D form size k*k*3.

Xem thêm: Nêu Đặc Điểm Chung Của Ngành Ruột Khoang ? Đặc Điểm Chung Và Vai Trò Của Ngành Ruột Khoang


*
Sau pooling layer (2*2).Source: http://cs231n.github.io/convolutional-networks/

Có 2 một số loại pooling layer thông dụng là: max pooling với average pooling.


*
lấy ví dụ như quy mô convolutional neural network. Source: https://www.easy-tensorflow.com/tf-tutorials/convolutional-neural-nets-cnns

Có thể coi cụ thể vào từng layer tại đây.


Mạng VGG 16

VGG16 là mạng convolutional neural network được lời khuyên vày K. Simonyan & A. Zisserman, University of Oxford. Model sau khoản thời gian train do mạng VGG16 đạt độ đúng mực 92.7% top-5 chạy thử vào tài liệu ImageNet bao gồm 14 triệu hình hình ảnh trực thuộc 1000 lớp không giống nhau. Giờ áp dụng kỹ năng ở trên nhằm so sánh mạng VGG 16.


Phân tích:

Convolutional layer: kích cỡ 3*3, padding=1, stride=1. Tại sao không ghi stride, padding nhưng mà vẫn biết? Vì mặc định sẽ là stride=1 cùng padding để cho output cùng width với height cùng với input đầu vào.Pool/2 : max pooling layer với kích cỡ 2*23*3 conv, 64: thì 64 là số kernel vận dụng vào layer đấy, tuyệt depth của output của layer đấy.Càng các convolutional layer sau thì kích cỡ width, height càng giảm nhưng mà depth càng tăng.Sau không ít convolutional layer cùng pooling layer thì tài liệu được flatten cùng cho vào fully connected layer.

Bài sau mình đã reviews về keras với hướng dẫn sử dụng keras để áp dụng convolutional neural vào các vận dụng như nhận diện số viết, dự đoán góc di chuyển vào xe hơi tự lái.



Search for:

Bài viết ngay gần đây


Mục bài bác viết


Deep Learning cơ bạn dạng ©2021. All Rights Reserved. Powered by WordPress.Theme by Phoenix Web Solutions