Thứ Tư, Ngày 16 Tháng 7, 2025

Ngôn ngữ trong trí tuệ nhân tạo và sự bùng nổ của truyền thông số

(CATP) Ngay từ khi máy tính vừa xuất hiện, con người đã đặt nhiều kỳ vọng vào máy tính: nhà khoa học muốn chế tạo các máy biết suy luận, biết tư duy như con người, nghĩa là biết giải quyết các vấn đề một cách thông minh.

Bước đầu họ đạt được những thành tựu đáng khích lệ. Ngay từ năm 1959 đã có những máy biết giải các phương trình đại số, biết tính tích phân. Rồi những chương trình đầu tiên dạy cho máy biết phân tích và tổng hợp tiếng nói con người xuất hiện từ những năm 1966 - 1968. Thuật ngữ "trí tuệ nhân tạo" (TTNT, artificial intelligence) xuất hiện từ những ngày ấy. Và một ngành khoa học mới ra đời: trí tuệ nhân tạo.

1. Trong buổi sơ khai, người ta nghĩ rằng thành phần chủ yếu của trí tuệ chính là khả năng suy luận logic có thể áp dụng cho mọi lĩnh vực. Thế là các nhà khoa học đổ xô vào tìm kiếm các quy luật tổng quát của tư duy và cố gắng xây dựng những "hệ thống vạn năng dùng để giải mọi bài toán". Sau nhiều năm mò mẫm, tìm kiếm mà kết quả không được bao nhiêu, các nhà khoa học đành rút xuống những mục tiêu khiêm tốn hơn: trước hết, hãy xây dựng cho máy tính trở thành các "chuyên gia thành thạo" trong từng lĩnh vực khoa học cụ thể. Và ở mục tiêu khiêm tốn này, con người đã đạt được những thành công đặc biệt. Thuật ngữ "hệ chuyên gia", còn gọi là "hệ thông minh" (Expert System) ra đời từ đó.

Thế nào là một HCG (hệ chuyên gia)? Nói nôm na, đó là một chương trình viết cho máy tính để nó có khả năng mô phỏng cách lập luận logic của con người và máy có tri thức của các chuyên gia trong một lĩnh vực hẹp nào đó, trở thành một "bách khoa thư” trong lĩnh vực đó. Tri thức cung cấp cho máy càng nhiều, càng chính xác thì chất lượng HCG càng cao. Và đó cũng là vấn đề làm thế nào để từ khối lượng đồ sộ các tri thức, máy có khả năng phân tích, trả lời những câu hỏi và đưa ra những lời khuyên về phương án hành động mà người hỏi quan tâm.

Có những "chuyên gia - máy" đã đạt trình độ cao khiến các "chuyên gia - người" kinh ngạc, khâm phục. Feigenbaum và các cộng sự ở Đại học Stanford đã thiết kế HCG hóa học DENDRAL có thể suy diễn ra các cấu trúc hóa học từ cơ sở kiến thức hóa - lý hiện có. Đây là một hệ chẩn đoán. HCG sinh học MOLGEN (1977) giúp các nhà sinh học phân tử phân tích gene theo kỹ thuật di truyền. PROSFECTOR (1979) là một HCG dùng trong tìm kiếm và nghiên cứu địa chất. Các HCG y học được tập trung nghiên cứu nhiều nhất và đạt được những thành tựu rực rỡ nhất. Từ kiến thức của 500 bệnh và hơn 3.500 triệu chứng về những bệnh đó, J. Mayer và H. Pople đã xây dựng HCG INTERNIST có thể kê đơn điều trị cho 80% số bệnh quan trọng. HCG y học MYCIN của E. Stertliff là một chuyên gia lành nghề trong việc chẩn đoán nhiễm trùng máu và viêm màng não. HCG MEDICOMP đã góp phần cứu sống nhiều bệnh nhân, trong đó có một em bé bị lao màng não ở giai đoạn đầu.

TTNT đã thực sự trở thành một lực lượng sản xuất mới đầy năng động và rất trí tuệ.

2. Câu hỏi đầu tiên đặt ra khi nghiên cứu về TTNT là: Làm thế nào để máy giao tiếp được với con người? Muốn vậy, cần xây dựng cho máy thứ ngôn ngữ có thể biểu hiện được các nội dung và quá trình được diễn đạt bằng bất kỳ một ngôn ngữ tự nhiên nào. Đó là ngôn ngữ lập trình, cũng gọi là ngôn ngữ thảo chương. Những ngôn ngữ lập trình đầu tiên rất phức tạp và chỉ các nhà chuyên môn về lập trình mới hiểu và sử dụng được máy.

Sự phát triển của máy tính và ứng dụng rộng rãi của chúng trong mọi lĩnh vực hoạt động của con người khiến các nhà khoa học phải cải tiến các ngôn ngữ lập trình sao cho việc sử dụng chúng ngày càng dễ dàng hơn, thậm chí một người dân thường cũng có thể hiểu và sử dụng được. Theo hướng đó, từ các ngôn ngữ lập trình quen thuộc như PASCAL, FORTRAN, PL/1... ở thập kỷ 70 của thế kỷ trước, người ta đã xây dựng các ngôn ngữ mạnh hơn, như PROLOG, LISP, QA4, PLANNER...

Bước phát triển thứ hai: Làm thế nào để máy có thể hiểu được ngôn ngữ tự nhiên, nghĩa là có thể "nghe" được lời nói, học "đọc" được chữ viết? Câu hỏi này thúc đẩy lý thuyết nhận dạng phát triển: Cần "dạy" cho máy nhận dạng được chuỗi âm thanh liên tục được truyền thành các dãy xung điện mà người nói phát ra hoặc nhận dạng ảnh, nhận dạng chữ viết do người đánh máy thực hiện. Từ đó xuất hiện các hệ nhận dạng tiếng nói và hình ảnh, như hệ HEAR-SAN hoặc hệ HARPY.

Sau khi nhận được dạng, máy cần hiểu những gì đã thu nhận được qua lời nói hoặc chữ viết. Tới đây có vai trò của ngôn ngữ học. Cần cung cấp cho máy các quy tắc hình thức để nhận biết từ ngữ, nhận biết các cấu trúc cú pháp, ngữ nghĩa cũng như ngữ dụng của một câu, một đoạn. Thế là ngành ngôn ngữ học tính toán (computational linguistics) ra đời cùng với sự xuất hiện của máy tính. Người ta đưa vào máy các ngữ pháp hình thức của ngôn ngữ tự nhiên, chẳng hạn ngữ pháp phi ngữ cảnh (context-free grammar) của N. Chomsky.

Ý nghĩa của một câu nói thường rất rộng. Mà biểu diễn tri thức cho máy, chủ yếu là biểu diễn ngữ nghĩa. Cho nên sự phát triển của TTNT lại mở ra một chuyên ngành ngôn ngữ học mới: Ngữ nghĩa học tính toán (NNHTT - computational semantics). Thuật ngữ này xuất hiện từ năm 1976. Để phục vụ cho TTNT, hiện nay người ta tìm kiếm các ngữ pháp ngữ nghĩa (semantic grammar). Vấn đề trung tâm của NNHTT là khảo cứu các thuật toán ngữ nghĩa và các siêu ngôn ngữ ngữ nghĩa.

Trước đây, để biểu diễn tri thức vào máy tính, người ta dùng logic vị từ cấp I và các luật suy diễn ở dạng "Nếu... thì...". Hai công cụ trên chưa đáp ứng đầy đủ nhiệm vụ đó. Nhà nghiên cứu tìm kiếm thêm các công cụ mới. Tri thức được biểu diễn thành một lưới ngữ nghĩa ở cả hai phương diện động và tĩnh của trí nhớ. Người ta cũng dùng cấu trúc giàn hoặc siêu lưới hoặc các siêu ngôn ngữ ngữ nghĩa khác để biểu hiện tri thức.

Sau khi cung cấp tri thức cho máy, làm thế nào để biết máy đã "hiểu" những nội dung mà người ta cung cấp cho nó? Nhà nghiên cứu dùng "lý thuyết hỏi và đáp" - những hướng nghiên cứu trong logic học và ngôn ngữ học - để giải quyết vấn đề này: Hãy đặt cho máy những câu hỏi rồi xem xét những câu trả lời của nó. Thế là vấn đề "máy hiểu ngôn ngữ tự nhiên" được thu gọn lại thành vấn đề "máy hiểu câu hỏi và tạo câu trả lời".

Một công việc tiếp theo hết sức quan trọng: Sau khi máy đã có tri thức, đã hiểu ngôn ngữ tự nhiên, làm thế nào để máy sử dụng và khai thác được những tri thức đó? Thế là phải nghiên cứu vấn đề "dạy" cho máy biết tư duy, biết suy luận thông minh, biết "tự học" một cách thông minh những thao tác tư duy mới, những suy luận mới. Các nhà khoa học tìm kiếm các chương trình mô phỏng cách lập luận của con người, chúng được gọi là cơ chế suy luận hay moteur suy diễn (inference engine). Cơ chế này độc lập với kiến thức của các HCG. Trong mọi cơ chế, người ta đều dùng hai luật suy diễn cơ bản trong logic, đó là modus ponens và modus tollens. Con người dễ dàng nhận ra các tình huống dẫn tới việc áp dụng hai luật suy diễn trên. Còn máy thì suy diễn hình thức và máy móc. Vậy rất quan trọng là vấn đề "dạy" cho máy tránh được những suy diễn thừa, biết định hướng khi suy diễn và biết kết thúc khi cần thiết. "Trí tuệ" của một HCG chính là ở chỗ nó có khả năng và biết cách giải thích cũng như định hướng được các suy diễn của mình trên con đường tìm kiếm lời giải đáp một vấn đề.

3. Trên con đường thiết kế các chuyên gia - máy thông minh, con người đã tiến những bước khổng lồ. Buổi đầu là những chương trình dạy cho máy giải được các câu đố, thực hiện các suy luận thông thường để đánh cờ, chơi các trò chơi dân gian, giải các bài toán hình học phẳng, các chương trình đại số, rồi tiến đến giải các bài toán ở trình độ sau đại học (1980)... Sau này, con người đã thiết kế được các hệ hỏi - đáp thông minh, mà tiêu biểu là các hệ SIR, QA2, QA3, QA4... Douclas và Lenat (1985) đã xây dựng một HCG khá tổng quát mang tên EURISKO, nó thực hiện được nhiều nhiệm vụ thuộc các lĩnh vực rất khác nhau theo những quy tắc suy luận, tìm kiếm độc đáo. Chat GPT hiện đang trở nên phổ biến ngày nay một phần hình thành từ cơ chế dựa trên sự kết hợp dữ liệu lớn (big data).

4. Các nước tiên tiến đã có những chương trình khổng lồ để nghiên cứu thế hệ máy tính điện tử thứ năm (với tốc độ siêu nhanh) và TTNT. Từ năm 1986 - 1988 ở Nhật Bản đã có hiện tượng "bùng nổ" các HCG. Hiện tại, thế giới đang nghiên cứu máy tính lượng tử có thể giải quyết cực nhanh những vấn đề phức tạp mà các siêu máy tính hiện nay dù mất hàng triệu năm vẫn không tìm ra được lời giải đáp. Chúng ta hy vọng đây sẽ là thế hệ kế tiếp của máy tính.

Đặt vấn đề TTNT và sự bùng nổ công nghệ trong bối cảnh ngành truyền thông, trong đó có báo chí đang diễn ra cuộc cách mạng số hóa để thấy rằng đây là lĩnh vực tiên phong cho xu hướng phát triển mạnh mẽ của thời đại. Xu hướng đó buộc các tòa soạn, các cơ quan truyền thông phải kiên quyết đoạn tuyệt với cách thông tin xưa cũ để áp dụng công nghệ, cải tiến đồng bộ và toàn diện quy trình tòa soạn, từ khâu thu thập tin tức đến sản xuất và phát hành sản phẩm. Đó là điều kiện sống còn của các cơ quan báo chí hiện nay.

----------------------------------------

(*) Bài viết được dẫn lại từ công trình của GS.TS Nguyễn Đức Dân đăng trên Tạp chí Ngôn ngữ năm 1989. Tít do tòa soạn đặt lại.

GS.TS NGUYỄN ĐỨC DÂN

Từ Khóa trí tuệ nhân tạo