Machine Learning là gì? Tầm quan trọng của sự dụng Machine Learning

Machine learning đang là một trong những công nghệ phổ biến nhất hiện nay, nó thúc đẩy tiến bộ trong đa dạng các lĩnh vực như xử lý ảnh, phân tích văn bản, khai phá dữ liệu… Vậy Machine Learning là gì? Tầm quan trọng của sự dụng Machine Learning

Machine Learning là gì? Tầm quan trọng của sự dụng Machine Learning

Trong bài viết này, chúng tôi sẽ giúp bạn hiểu rõ hơn về công nghệ machine learning và những thuật ngữ liên quan như ai, deep learning hay data mining là gì,...

Machine Learning là gì?

Có 2 định nghĩa Machine Learning như sau:

  • Theo Arthur Samuel (1959): Máy học là ngành học cung cấp cho máy tính khả năng học hỏi mà không cần được lập trình một cách rõ ràng

  • Theo Giáo sư Tom Mitchell – Carnegie Mellon University: Machine Learning là 1 chương trình máy tính được nói là học hỏi từ kinh nghiệm E từ các tác vụ T và với độ đo hiệu suất P. Nếu hiệu suất của nó áp dụng trên tác vụ T và được đo lường bởi độ đo P tăng từ kinh nghiệm E

Để hiểu hơn về machine learning là gì, hãy nhìn lại một số khái niệm cơ bản về trí tuệ nhân tạo AI (Artificial Intelligence).

Machine Learning là gì?

AI là gì?

AI là viết tắt của Artificial Intelligence, dịch ra thành Trí tuệ nhân tạo.

Trí tuệ nhân tạo - AI có thể hiểu đơn giản là được cấu thành từ các lớp xếp chồng lên nhau, trong đó mạng thần kinh nhân tạo nằm ở dưới đáy, machine learning nằm ở tầng tiếp theo và deep learning nằm ở tầng trên cùng.

Trong lịch sử phát triển AI, các nhà nghiên cứu phân thành 4 hướng tiếp cận chính:

  • Hành động như người (acting humanly)

  • Suy nghĩ như người (thinking humanly)

  • Suy nghĩ hợp lý (thinking rationally)

  • Hành động hợp lý (acting rationally)

AI là gì?

Trong đó, mức độ mô phỏng máy tính như người là khó nhất và đây cũng là mục tiêu mà các nhà khoa học đang hướng tới. Ngoài ra, AI còn hướng đến khả năng máy tính có thể suy luận gồm những đặc trưng sau:

  • Suy luận (reasoning): khả năng giải quyết vấn đề bằng suy luận logic.

  • Tri thức (knowledge): khả năng biểu diễn tri thức về thế giới xung quanh (hiểu được có bao nhiêu đối tượng, sự kiện, tình huống hiện hữu trong thế giới thực và được phân loại dựa trên đặc tính của từng đối tượng đó).

  • Lập kế hoạch (planning): khả năng thiết lập và đạt được mục tiêu đề ra dựa trên tri thức đã biểu diễn được.

  • Giao tiếp (communication): khả năng hiểu được ngôn ngữ viết và nói của con người.

  • Nhận thức (perception): khả năng suy luận về thế giới từ hình ảnh thị giác, âm thanh và các đầu vào giác quan khác.

Chắc hẳn bạn đọc đã từng nghe đến câu chuyện Turing test. Bài test gồm một người đặt câu hỏi, một người trả lời câu hỏi và một máy tính phản hồi câu hỏi. Nếu trong quá trình trao đổi mà người đặt câu hỏi không thể phân biệt được người hay máy trả lời các câu hỏi này thì máy được xem là thông minh. Đến nay thì hướng tiếp cận này đã đạt được một số thành quả nhất định như:

  • Natural language processing: máy có khả năng đọc hiểu và giao tiếp bằng ngôn ngữ tự nhiên với người.

  • Knowledge representation: máy có khả năng lưu trữ tri thức thông qua thị giác, thính giác, hay văn bản.

  • Automated reasoning: máy có khả năng sử dụng tri thức đã lưu trữ để trả lời câu hỏi hay đưa ra kết luận hữu ích.

  • Machine learning: máy có khả năng thích nghi với các điều kiện môi trường xung quanh để rút trích ra các nguyên lý từ tri thức thu nhận được phục vụ cho việc ra quyết định.

  • Computer vision: máy có khả năng quan sát và xác định được các đối tượng xung quanh.

  • Robotics: máy có khả năng tương tác với đối tượng và di chuyển trong môi trường xung quanh.

Như vậy, ta có thể thấy Machine Learning chỉ là một thành phần trong hướng tiếp cận hành động như người, và hướng tiếp cận này lại thuộc bốn hướng tiếp cận của AI.

Deep learning là gì?

Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu.
Deep Learning được ứng dụng trong nhận diện hình ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên.
Điểm đặc biệt của Deep Learning là tính chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không bị hạn chế.

Deep learning là gì?

Vậy Data mining là gì?

Data mining - khai phá dữ liệu là quá trình phân loại, sắp xếp các tập hợp dữ liệu lớn để xác định các mẫu và thiết lập các mối liên hệ nhằm giải quyết các vấn đề nhờ phân tích dữ liệu. Các công cụ khai phá dữ liệu cho phép các doanh nghiệp có thể dự đoán được xu hướng tương lai.

Vậy Data mining là gì?

Machine learning làm việc như thế nào?

Một trong những cuốn sách đầu tiên tôi đọc hồi 10 năm trước là Machine Learning by Tom Mitchell. Cuốn sách này được viết năm 1997, nhưng kiến thức trong đó vẫn chuẩn xác cho tới ngày hôm nay.

Trong cuốn sách đó, định nghĩa của tác giá về machine learning là:

A computer program is said to learn to perform a task T from experience E, if its performance at task T, as measured by a performance metric P, improves with experience E over time

Tạm dịch: Một chương trình máy tính được cho là học để thực hiện một nhiệm vụ T từ kinh nghiệm E, nếu hiệu suất thực hiện công việc T của nó được đo bởi chỉ số hiệu suất P và được cải thiện bởi kinh nghiệm E theo thời gian.

Ví dụ: Một cỗ máy thực hiện chơi cờ(nhiệm vụ T), có thể học từ dữ liệu các ván cờ trước đó hoặc chơi với một chuyên gia(kinh nghiệm E). Khả năng chơi của cỗ máy là tỉ lệ số ván mà nó chiến thắng khi chơi với con người(hiệu suất P).

Các ví dụ thực tế khác

  • VD1: Một hệ thống nhận vào một hình ảnh, nó phải xác định xem trong đó có khuôn mặt của Ngọc Trinh hay không. Điều này thấy rõ nhất ở chức năng tự động gắn thẻ khuôn mặt của Facebook.

Nhiệm vụ phát hiện khuôn mặt của người mẫu Ngọc Trinh trong một bức ảnh. Kinh nghiệm có thể là một tập hợp các ảnh có khuôn mặc Ngọc Trinh và một tập ảnh khác không có. Hiệu suất sẽ được tính bằng tỉ lệ đoán chính xác trên một tập ảnh mới.

  • VD2: Hệ thống nhận vào các reviews về một sản phẩm đồ ăn. cần xác định các reviews đó có nội dung tích cực hay tiêu cực.

Nhiệm vụ của bài toán là là gán nhãn cho mỗi review. Kinh nghiệm ở đây có thể là tập hợp các review và nhãn tương ứng của nó. Hiệu suất được đo bằng tỉ lệ dự đoán nhãn chính xác trên các review mới.

  • VD3: Một hệ thống nhận vào hình ảnh/ thông tin của một người. Đánh giá số điểm đo khả năng người đó sẽ trả một khoản vay tín dụng.

Bài toán cần giải quyết là đánh giá điểm tin cậy của người dùng để thực hiện cho vay tín dụng. Kinh nghiệm có thể học được từ các tập hình ảnh/ thông tin của những người vay tín dụng trước đi kèm thông tin họ có chi trả khoản vay tín dụng đó không. Hiệu suất của mô hình sẽ được đo bằng tỉ lệ dự đoán đúng trên tập khách hàng mới.

Huấn luyện mô hình

Làm sao thuật toán có thể thể đưa ra đầu ra mong muốn từ tập dữ liệu đầu vào? Bạn cần một quá trình huấn luyện sử dụng các dữ liệu huấn luyện. Nó chính là kinh nghiệm E ở định nghĩa trên.

Một tập dữ liệu huấn luyện bao gồm nhiều mẫu huấn luyện. Mỗi mẫu huấn luyện sẽ là một thể hiện của bài toán(có đầu vào và lời giải). Machine learning sẽ học từ các thể hiện đó để tìm ra lời giải phù hợp với từng đầu vào mới. Nó giống như là bạn dạy 1 đứa trẻ cách ném 1 quả bóng; bạn sẽ ném quả bóng vài lần cho đứa trẻ quan sát; Sau đó đứa trẻ sẽ bắt đầu học để tự ném quả bóng.

Các ví dụ trong tập huấn luyện thường có một tập thuộc tính/ đặc trưng cố định. Đó là những thể hiện để mô tả về đối tượng đó. Như trong VD1, đặc trưng có thể là tần suất các màu của mỗi bức ảnh. Trong VD2, các đặc trưng một review sẽ là các từ tạo nên review đó. Còn VD3, các đặc trưng có thể là tuổi tác, công việc, mức lương của mỗi người,…

Lựa chọn các đặc trưng thích hợp là một nhiệm vụ quan trọng trong Machine learning.

Machine learning làm việc như thế nào?

Machine learning được sử dụng ra sao?

Đã bao giờ bạn tự hỏi làm thế nào người cho vay có thể cung cấp gần như tức thời câu trả lời cho các yêu cầu vay tiền của bạn? Nhiều hoạt động hàng ngày của chúng ta được trợ giúp bởi các thuật toán machine learning, bao gồm:

  • Phát hiện gian lận.

  • Các kết quả tìm kiếm trên web.

  • Quảng cáo theo thời gian thực trên các trang web và các thiết bị di động.

  • Phân tích tình cảm dựa trên văn bản.

  • Điểm số tín dụng và lời mời chào tiếp theo tốt nhất.

  • Dự đoán những hư hỏng của thiết bị.

  • Những mô hình định giá mới.

  • Phát hiện xâm nhập mạng.

  • Nhận dạng qua pattern (mẫu) và hình ảnh.

  • Lọc bỏ các email spam.  

Một ứng dụng phổ biến của machine learning hiện nay là việc nhận dạng pattern (mẫu) bởi vì nó có thể được sử dụng để nhận ra nhiều loại hình ảnh khác nhau. Ví dụ, Bưu điện Mỹ sử dụng machine learning để nhận dạng chữ viết tay.