Chương 1. TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO
1.1. TRÍ TUỆ NHÂN TẠO, MÁY HỌC, HỌC SÂU VÀ MẠNG NO-RON NHÂN TẠO
Trí tuệ nhân tạo hay cách gọi khác là thông minh nhân tạo được dịch từ cụm từ tiếng Anh artificial intelligence (AI) và được định nghĩa trong nhiều tài liệu khác nhau. Có thể hiểu một cách chung nhất trí tuệ nhân tạo là một chương trình máy tính hay một hệ thống có khả năng xử lý như cách mà một con người xử lý bao gồm khả năng nhận dạng, suy luận, phán đoán như bộ não con người. Tuy nhiên, bộ não con người là một hệ thống xử lý phức tạp mà cho đến giai đoạn hiện nay chưa có một phần mềm nào, một thiết bị nào có thể hoàn toàn xử lý giống nó được. Ở một góc độ nhỏ, trí tuệ nhân tạo được xem như một chương trình máy tính có khả năng mô hình hoá một hoặc một vài chức năng nào đó của bộ não người, cụ thể như khả năng nhận dạng, khả năng suy luận và khả năng dự đoán để đưa ra quyết định.
Hình 1.1: Trí tuệ nhân tạo, máy học, học sâu và mạng nơ-ron nhân tạo
Trí tuệ nhân tạo là một khoa học rộng lớn, nó bao gồm các lĩnh vực như máy học, học sâu và mạng nơ-ron nhân tạo được minh họa trong hình 1.1. Máy học là một nhánh của trí tuệ nhân tạo, được định nghĩa rất sớm bởi Arthur Samuel, năm 1959. Máy học về cơ bản vẫn là các chương trình máy tỉnh có khả năng học mà không cần lập trình rõ ràng trước. Các chương trình một khi được tạo ra sẽ có khả năng học để thực hiện những hoạt động một cách thông minh ngoài những khái niệm đã được lập trình. Các chương trình máy học cho phép xây dựng các hệ thống thông minh nhân tạo, có khả năng tự học, tự thích nghỉ trong quá trình vận hình, xử lý, suy luận và dự đoán kết quả đạt được dựa vào các kết quả đã nhận được trong quả khử.
Tuy máy học là một thành phần của khoa học trí tuệ nhân tạo nhưng có một điểm khác biệt để tạo nên đặc thù của nó. Máy học cho phép một chương trình máy tính tạo ra kết quả ngõ ra hoặc thực hiện các tác vụ mà nó chưa được lập trình rõ ràng trước đó để thực hiện. Máy học tập trung vào việc đưa ra các dự đoán tương lai hơn là được lập trình để đưa ra các quyết định. Nếu một chương trình có khả năng xử lý thông minh như cách mà con người xử lý thì nó có thể là một trí tuệ nhân tạo hoặc máy học. Tuy nhiên, nếu các thông số của các chương trình như vậy không được cập nhật từ dữ liệu thì nó không phải là một chương trình ứng dụng trí tuệ nhân tạo hoặc máy học.
Mạng nơ-ron nhân tạo là một mô hình xử lý thông tin được mô phóng dựa trên cấu trúc và chức năng của hệ thống thần kinh sinh vật.. Mạng nơ-ron nhân tạo là một hướng tiếp cận của máy học, trong đó bao gồm các thuật toán xử lý các tín hiệu lan truyền qua các kết nối được mô hình hoá từ các khớp thần kinh trong não con người. Khi số lượng các lớp mạng tăng lên để tăng khả năng biểu diễn dữ liệu ta có mạng sâu hay học sâu (Deep learning).
1.2. NO-RON NHÂN TẠO
Nơ-ron nhân tạo là đơn vị cơ bản để cấu thành nên các mạng nơ-ron nhân tạo sử dụng trong hầu hết các ứng dụng trí tuệ nhân tạo. Nơ-ron nhân tạo là một mô hình toán học của các đơn vị nơ-ron thần kinh trong não bộ con người. Các nơ-ron kết nối với nhau theo nhiều thể thức khác nhau để lan truyền các tín hiệu trong mạng nơ-ron. Hoạt động của nơ-ron nhân tạo được mô hình hỏa từ hoạt động của nơ-ron sinh học.