Deep learning là gì? Giải thích về ý nghĩa công nghệ Deep learning

Deep Learning đang là một trong những công nghệ phổ biến nhất hiện nay, nó thúc đẩy tiến bộ trong đa dạng các lĩnh vực như nhận thức sự vật, dịch tự động, nhận diện giọng nói,… Vậy Deep Learning là gì? Giải thích về ý nghĩa công nghệ Deep learning

Deep Learning là gì? Giải thích về ý nghĩa công nghệ Deep learning

Deep learning là gì?

Deep learning là một phạm trù nhỏ của machine learning. Deep learning tập trung giải quyết các vấn đề liên quan đến mạng thần kinh nhân tạo nhằm nâng cấp các công nghệ như nhận diện giọng nói, tầm nhìn máy tính và xử lý ngôn ngữ tự nhiên.

Để hiểu hơn về deep learning là gì, hãy nhìn lại một số khái niệm cơ bản về trí tuệ nhân tạo (Artificial Intelligence).

Trí tuệ nhân tạo - AI có thể hiểu đơn giản là được cấu thành từ các lớp xếp chồng lên nhau, trong đó mạng thần kinh nhân tạo nằm ở dưới đáy, machine learning nằm ở tầng tiếp theo và deep learning nằm ở tầng trên cùng.

Deep learning là gì?

Mạng thần kinh nhân tạo

Trong công nghệ thông tin, mạng thần kinh nhân tạo là một hệ thống các chương trình và cấu trúc dữ liệu mô phỏng cách vận hành của não người.
Nói cách khác, nếu ví mạng thần kinh nhân tạo với não người thì các neuron thần kinh chính là các node (node là đơn vị thần kinh trong mạng thần kinh nhân tạo – mỗi chiếc máy tính trong mạng thần kinh có thể được xem như 1 node) được kết nối với nhau trong một mạng lưới lớn. Bản thân từng node này chỉ trả lời được những câu hỏi hết sức cơ bản chứ không hề thông minh, nhưng khi được gộp chung với nhau thì chúng lại có sức mạnh xử lý được cả những tác vụ khó. Và điều quan trọng ở đây là bằng những thuật toán phù hợp, chúng ta có thể dạy và huấn luyện được chúng.

Machine và deep learning

Machine learning là chương trình chạy trên một mạng thần kinh nhân tạo, có khả năng huấn luyện máy tính "học" từ một lượng lớn dữ liệu được cung cấp để giải quyết những vấn đề cụ thể.

Ví dụ nếu muốn dạy máy tính cách băng qua đường, theo cách truyền thống bạn sẽ đưa cho nó một loạt quy tắc hướng dẫn cách nhìn trái phải hay đợi xe và người đi qua,… Thế nhưng nếu dùng machine learning, bạn sẽ cho máy tính xem 10.000 video quay cảnh người ta băng qua đường an toàn và 10.000 video quay cảnh ai đó bị xe đâm để nó tự học theo.

Machine và deep learning

Các ứng dụng của deep learning là gì?

Ngoài ra bạn tham khảo thêm về Deep web là gì?

Hệ gợi ý trên các nền tảng

Hệ gợi ý là một trong những yếu tố đóng vai trò quan trọng trong sự thành công của những ông lớn như Netflix, Amazon, Youtube, ... Với việc áp dụng hệ gợi ý, hệ thống có khả năng đưa ra những gợi ý về sản phẩm mà người dùng có thể muốn mua, từ đó tăng lợi nhuận và cung cấp những trải nghiệm tốt cho khách hàng.

Hệ gợi ý được chia thành 2 mảng lớn: Content-based và Collaborative Filtering.

Phương pháp Content-based hướng tới việc phân tích những thuộc tính của từng sản phẩm và khám phá sở thích của người dùng tới từng thuộc tính đó để đưa ra những sản phẩm phù hợp cho từng người dùng.

Phương pháp Collaborative Filtering hướng tới việc phân tích những điểm tương đồng giữa các người dùng và đưa ra gợi ý cho một người dùng dựa trên những người dùng có sự tương đồng với người dùng đó (User Collaborative Filtering) hoặc dựa trên những sản phẩm có độ tương đồng với các sản phẩm người dùng đã tiêu thụ (Item Collaborative Filtering).

Cả 2 phương pháp trên đều có thể được cài đặt bằng Deep Learning trên những tập dữ liệu khổng lồ để đưa ra các gợi ý về sản phẩm cho người dùng.

Xem thêm: Deepweb là gì ?

Phân tích ngữ nghĩa văn bản

Rất nhiều ứng dụng và hệ thống hiện nay có chức năng review dành cho người dùng. Qua việc đưa ra review cho một sản phẩm, người dùng có thể nêu ra những ý kiến cá nhân của mình, sự hài lòng hay không hài lòng về sản phẩm đó. Giờ đây, với công nghệ Deep Learning và sự ra đời của mạng hồi quy (Recurrent Neural Network), chúng ta đã có khả năng tách lọc ra các thông tin từ các phản hồi của người dùng. Từ những thông tin này, ta có thể đánh giá về mức độ hài lòng của khách hàng tới sản phẩm hoặc lọc ra những từ khóa quan trọng về sản phẩm đó.

Chatbots

Chatbots là một công nghệ đã có từ khá lâu nhưng mới chỉ bùng nổ vào khoảng 10 năm gần đây. Với sự ra đời của mạng hồi quy, việc phân tích ngữ nghĩa của các câu hội thoại đã trở nên chính xác hơn rất nhiều và từ đó các chatbot có khả năng phân tích thông tin từ những câu hội thoại của người dùng và đưa ra những phản hồi hợp lý.

Nhận diện hình ảnh

Đây là một trong những mảng lớn của Deep Learning với rất nhiều những ứng dụng thực tiễn. Công nghệ nhận diện và phân loại hình ảnh có ứng dụng trực tiếp trên mảng computer vision, giúp các hệ thống trí tuệ nhân tạo có khả năng phân tích và xử lý hình ảnh như một con người. Từ đó, các hệ thống này có khả năng thực hiện các tác vụ như: nhận diện khuôn mặt, nhận diện thực thể, phân loại ảnh và video, …

Thực tế hiện nay Deep Learning được ứng dụng trên rất nhiều các mảng khác nhau, từ phân tích tài chính, dự đoán đầu tư trong kinh tế thị trường đến các ứng dụng trong y học như chẩn đoán ung thư, chẩn đoán gen xấu,... Hy vọng qua bài viết này các bạn sẽ có được một cái nhìn tổng quát hơn về Deep Learning. (Xem chi tiết: Deepfake là gì ?)

 

Deep learning trở nên phổ biến trong thập kỉ gần đây nhờ vào sự gia tăng nhanh chóng của lượng dữ liệu số mà loài người tạo ra, ngoài ra còn nhờ sức mạnh xử lý của máy tính gia tăng trong khi giá thành giảm xuống. Ở bài viết này chúng tôi sẽ giúp các bạn hiểu rõ hơn về deep learning là gì?

Deep learning là gì?

Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu.

Deep Learning được ứng dụng trong nhận diện hình ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.
Điểm đặc biệt của Deep Learning là tính chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không bị hạn chế.

Deep learning là gì?

Thuật toán Deep learning

Thuật toán Deep learning được tạo thành từ Artificial Neural Networks với các layers ẩn, dựa trên mạng thần kinh nơ-ron sinh học. Deep natural networks có thể được sử dụng để mô phỏng các mối quan hệ phức tạp phi tuyến tính trong cả giám sát ( tập dữ liệu được sử dụng để dự đoán kết quả sau này) và không giám sát ( gom nhóm và tìm ra các mẫu mới và khác thường trong dữ liệu ).

So với các thuật toán machine learning truyền thống, models deep learning cung cấp những cải tiến đáng kể trong Google Translate sau khi chuyển đổi từ Phrase Based Machine Translation (PBMT) sang Neural Machine Translation (NMT). Các mô hình Deep learning bao gồm các model Deep Autoencoders, Restricted Boltzmann Machines (RBMs), Convolutional Neural Networks (CNNs), Recurrent Neural Networks và Long Short-Term Memory (LSTM) phụ thuộc vào vùng ứng dụng là học tập có giám sát hay học tập không giám sát.

Vậy Deep Learning hoạt động như thế nào?

Vậy Deep Learning hoạt động như thế nào?

Deep Learning là một phương pháp của học máy. Nó cho phép chúng ta huấn luyện một AI có thể dự đoán được các đầu ra dựa vào một tập các đầu vào. Cả hai phương pháp có giám sát và không giám sát đều có thể sử dụng để huấn luyện.

Ví dụ: Chúng ta sẽ học cách deep learning hoạt động ra sao bằng cách xây dựng một dịch vụ dự đoán giá vé máy bay. Ta sẽ huấn luyện nó bằng phương pháp học có giám sát.

Chúng ta muốn dự đoán giá vé dựa vào các đầu vào như sau:

  • Sân bay khởi hành

  • Sân bay đến

  • Ngày bay

  • Hãng hàng không

Hạn chế của trí tuệ nhân tạo hiện nay

Hạn chế của trí tuệ nhân tạo hiện nay

Deep learning đang được sử dụng cho những thứ như nhận dạng giọng nói và nhận dạng hình ảnh, những thứ có nhiều tiềm năng thương mại hóa. Nhưng song song đó, nó cũng còn nhiều hạn chế.

  • Deep learning cần một lượng dữ liệu đầu vào khổng lồ để máy tính có thể học hỏi. Quy trình này mất nhiều thời gian, nhiều sức mạnh xử lý mà chỉ có các server cỡ lớn mới làm được.

  • Deep learning vẫn chưa thể nhận biết được những thứ phức tạp, ví dụ như các mối liên hệ thông thường. Lý do là vì hiện chưa có kĩ thuật nào đủ tốt để trí tuệ nhân tạo có thể rút ra những kết luận đó một cách logic.

  • Với một số bức hình đơn giản hơn nhưng mahcine vẫn nhầm lẫn. Thử nghiệm của một nhóm nhà nghiên cứu cho thấy rằng khi họ đưa máy tính xem một loạt ảnh chỉ có các pixel ngẫu nhiên nhưng máy lại chắc chắn đây 95% là một cái... xe tải, hay là một con sao biển...

  • Ví dụ bạn hãy thử hỏi những thứ cần đến suy nghĩ thông thường như "con cá sấu có lái xe được không" hay "một cầu thủ đá banh có được phép gắn cánh để bay hay không". Các câu hỏi dạng này quá phức tạp với những hệ thống trí tuệ nhân tạo hiện nay nên thường sẽ không có kết quả nào được trả về cho bạn, nếu có cũng là những thứ không liên quan hay chỉ đơn giản là search câu nói của bạn trên Internet.