(VietNamNet) - Công nghệ thông tin (CNTT) phổ cập hiện nay đã tạo khả năng phục hồi giá trị văn hoá chữ Nôm: chữ Nôm được thể hiện trên máy tính, được thể hiện trong CNTT đã tạo ra sự hấp dẫn và lực lôi kéo, thúc đẩy thế hệ trẻ quay trở lại với chữ Hán-Nôm. Ngày nay chúng ta đã có khả năng in ấn, xuất bản, sử dụng, truy nhập chữ Nôm trên máy tính và mạng Internet. Chính điều này mở ra con đường cho chữ Nôm trở lại với mọi người...
Chữ Nôm - Lịch sử và hiện đại
Chữ Nôm, cách viết "Việt hoá" từ chữ Hán với ý nghĩa tương tự, nhưng mang đậm bản sắc riêng. |
Sau bốn thế kỷ phát triển, năm 1920, chữ quốc ngữ đã dần trở thành chữ viết chính của Việt Nam, thay thế cho chữ Hán-Nôm đã được dùng trong suốt gần 1.000 năm. Một mặt, chữ quốc ngữ tỏ ra hiệu quả và phổ cập nhanh chóng, dễ dàng, không khó học vì không phải nhớ nhiều nên được nhân dân hưởng ứng. Mặt khác, các chính quyền cai trị Việt Nam cũng muốn xoá bỏ nền văn hoá và truyền thống chữ Hán-Nôm để thay thế bằng nền văn hoá công nghiệp phương Tây. Chữ Hán-Nôm bị coi là cổ hủ không thích hợp với thời đại mới.
Chữ Nôm là một dạng văn tự như kiểu chữ Hán nhưng diễn tả cho cách phát âm và ý nghĩa mà chỉ người Việt mới hiểu được. Trải qua một nghìn năm dựng và giữ nước, chữ Hán-Nôm thực sự là một công cụ chuyển tải tri thức, kinh nghiệm và sáng tạo của cha ông cho các thế hệ sau.
Khi cuộc sống ngày một được nâng cao, sự phục hồi các giá trị văn hoá cổ đã đem lại cách nhìn mới về chữ Hán-Nôm: Phải quan niệm chữ Hán-Nôm chính là chữ quốc ngữ cổ của chúng ta. Đó là chữ của dân tộc ta, mọi người đều có phần trách nhiệm gìn giữ và bảo tồn nó.
CNTT và chữ Nôm
CNTT phổ cập hiện nay đã tạo khả năng phục hồi giá trị văn hoá chữ Nôm: chữ Nôm được thể hiện trên máy tính, được thể hiện trong CNTT đã tạo ra sự hấp dẫn và lực lôi kéo, thúc đẩy thế hệ trẻ quay trở lại với chữ Hán Nôm. Ngày nay chúng ta đã có khả năng in ấn, xuất bản, sử dụng, truy nhập chữ Nôm trên máy tính và mạng Internet.
Để thực hiện việc trao đổi, hiển thị thông tin qua Internet, chúng ta cần mã hoá cho các ký tự, âm thanh hay hình ảnh dưới dạng dữ liệu số, từ dạng số chuyển thành tín hiệu điện và do đó máy tính có thể xử lý được. Mỗi chữ viết được đặt tương ứng với một giá trị số, và trên cơ sở đó, thông tin chữ viết của con người được biểu diễn bằng một chuỗi số chuẩn, thống nhất. Chữ Nôm cũng cần phải được đánh mã theo chuẩn quốc tế kiểu như vậy. Được thế, các máy tính sản xuất ra sẽ có khả năng xử lý chữ Nôm ngang hàng với mọi loại chữ khác.
Truyện Kiều của đại thi hào Nguyễn Du, tác phẩm văn học nổi tiếng được viết bằng chữ Nôm. |
Máy tính có khả năng xử lý nhanh chóng và ghi nhớ thật nhiều các chuỗi số này. Chính bởi sức nhanh tính toán của máy và sức chứa khối lượng cực kỳ lớn dữ liệu mà máy tính có khả năng thay thế và hỗ trợ cho con người trong những tính toán từ đơn giản tới phức tạp. Xã hội công nghệ hiện đại không thể thiếu được việc xử lý thông tin trên nền máy tính. Một tầng đệm mới giữa con người đã xuất hiện và đòi hỏi người ta phải làm chủ được tầng công nghệ này, làm chủ để có thể diễn đạt mọi hoạt động xử lý và lưu trữ, truyền thông tin của mình cho người khác. Mọi thông tin, ngữ nghĩa mà con người trao đổi bây giờ đều có thể được thực hiện qua trung gian máy tính, và máy tính cũng góp phần vào việc xử lý các thông tin ngữ nghĩa này.
Với khă năng này, máy tính giúp rất nhiều cho việc thể hiện và bảo tồn vốn văn hoá cổ mà chữ Nôm vẫn mang theo trong lòng nó. Chúng ta biết rằng chữ Nôm không chỉ được dùng để ghi âm mà còn được dùng để biểu thị ý nghĩa. Nói riêng, thông tin loại từ đều đã được bao hàm trong chữ Nôm. Hiển nhiên, nếu các nghiên cứu về chữ Nôm được tiến hành, chúng ta sẽ biết thêm nhiều về tiếng Việt cổ cũng như tiếng Việt hiện nay. Chữ quốc ngữ hiện nay cũng là một cách diễn đạt cho tiếng Việt mà thôi.
Những nỗ lực và thành quả bước đầu
Xin tóm tắt lại những kết quả chúng ta đã đạt được trên con đường đưa CNTT vào phục vụ cho chữ Nôm trong suốt 12i năm qua. Nhiều tiền của và công sức đã được bỏ ra để đạt được những kết quả tuy khiêm tốn nhưng cũng rất quan trọng này.
Về mã hoá, để đưa chữ Hán-Nôm vào bảng mã chuẩn quốc tế, chúng ta đã cung cấp cho Tổ chức Tiêu chuẩn Quốc tế ISO-IEC 10646/JTC 1/SC 2/ WG 2 gần 11.500 chữ Hán-Nôm và đã được chấp nhận đưa vào chuẩn Unicode và ISO 10646.
Về font chữ Nôm, chúng ta có sự tham gia giúp đỡ rất tích cực của Viện Văn tự kính Mojikyo Nhật Bản, Công ti Dynalab Hong Kong. Hai tổ chức này đã vẽ ra font Truetype cho 9.299 chữ Hán-Nôm mà chúng ta đã đề nghị. Nhóm các ni cô tại thiền viện Viên Chiếu (Bà Rịa-Vũng Tàu), với sự hướng dẫn của Đỗ Quốc Bảo, đã làm ra các bộ font HanNomA, HanNomB với con số chữ lên tới trên 30.000. Tại Hà Nội, nhóm Nôm Na cũng đã để cả năm phát triển và vẽ chữ Nôm theo phong cách riêng và cho tới nay đã vẽ được trên 17.000 chữ phục vụ cho việc in cuốn sách tra cứu từ điển một cách có hệ thống.
Về phần mềm, đã xuất bản công cụ tra cứu chữ Nôm trên mạng NLT, đặt tại địa chỉ http://www.nomfoundation.org. Công cụ này cho phép người dùng xuất phát từ chữ quốc ngữ, tìm ra tất cả các chữ Nôm tương ứng. Ngoài ra, một loạt thông tin liên quan tới chữ này, như nguồn gốc xuất xứ, các thí dụ ngữ cảnh ngắn, cũng được móc nối và giới thiệu cho người tra cứu. Tại nhiều nơi khác, nhiều phần mềm tra cứu từ điển và gõ chữ Nôm đã được xây dựng. Phan Anh Dũng ở Huế đã xây dựng các công cụ đánh chữ Nôm, tra cứu từ điển. Phần mềm này được Trung tâm Phần mềm Hue Soft hỗ trợ và đưa lên mạng. Tại TP.HCM, nhóm chuyên gia độc lập về Hán-Nôm và CNTT Lê Anh Minh và Tống Phước Khải đã phát triển các chương trình gõ chữ Nôm và tra cứu, và tổ chức trang web HanoSoft.
Về in ấn, trong thời gian qua đã có nhiều sách và từ điển chữ Hán-Nôm được in ấn trực tiếp từ máy tính. Có thể kể tới cuốn thơ Hồ Xuân Hương Spring Essence do thi sĩ John Balaban dịch sang tiếng Anh, được in bằng chữ Nôm, quốc ngữ và chữ Anh. Cuốn từ điển tra cứu "Giúp đọc Nôm và Hán Việt" của linh mục Trần Văn Kiệm cũng đã được làm chế bản trên máy tính sử dụng bộ font NomNaTong gồm trên 17.000 chữ. Sắp tới cuốn từ điển chữ Nôm của Viện Nghiên cứu Hán-Nôm cũng sẽ được in từ chế bản trên máy tính. Một số bản in truyện Kiều cũng đã được làm chế bản và in trên máy tính hoàn toàn.
Hướng phát triển mới cho chữ Nôm
Các văn tự cổ trong suốt 1.000 năm văn hiến của người Việt đều được lưu lại bằng chữ Hán-Nôm. |
Để bảo tồn các tư liệu chữ Nôm, cần phát triển các ứng dụng lưu trữ và quản lý các văn bản Hán-Nôm dạng điện tử ở cấp quốc gia, địa phương và gia đình, phổ biến miễn phí qua mạng. Chính việc nhiều người có khả năng truy nhập và sử dụng trực tiếp các nguồn tư liệu cổ chữ Hán-Nôm là một đảm bảo chắc chắn cho sự trường tồn của những vốn văn hoá cổ này. Việc cất giữ chu đáo các văn bản cổ trong các bảo tàng chắc chắn để mọi người chiêm ngưỡng cũng là một hình thức bảo tàng, nhưng cách gìn giữ chủ động hơn cả là làm cho vốn văn hoá đó sống ngay trong tâm khảm người Việt. Và đó là một trong những mục đích, chủ yếu của việc phổ biến mọi tài liệu chữ Nôm cho những người có nhu cầu.
Nhu cầu hiện tại về bảo tồn và phát huy vốn văn hoá phi vật thể, văn hoá khắc ghi trong các hiện vật có chữ Nôm cũng đang là một đòi hỏi của thực tế nước ta đối với ngành CNTT. Các ứng dụng CNTT vào lĩnh vực bảo tàng và thư viện đang đòi hỏi cần có cách tiếp cận toàn diện đầy đủ để không những chúng ta có thể lưu trữ, bảo tồn các vốn văn hoá cổ mà còn mở rộng cho mọi người dân tiếp xúc và hiểu biết về chúng. Do đó, việc phát triển ứng dụng CNTT trong những lĩnh vực này sẽ góp phần thúc đẩy sự phát triển của chữ Nôm và những nghiên cứu về chữ Nôm.
Nhu cầu lớn hiện nay đối với nghiên cứu chữ Nôm là cần xác định phương pháp luận nghiên cứu mới đối với các vấn đề liên quan tới chữ Nôm. Phương pháp luận nghiên cứu này dựa trên việc sử dụng tiến bộ CNTT giúp cho nghiên cứu về chính bản thân chữ Nôm, các văn bản cổ và sự phát triển của tiếng Việt qua các văn tự. Với khả năng của máy tính, có thể tích trữ vào trong nó rất nhiều tư liệu, gần như có thể vét cạn cả kho tư liệu sách vở thông thường, người nghiên cứu giờ đây có thể có con mắt bao quát, xuyên suốt nhiều tư liệu để rút ra các đặc trưng của ngôn ngữ, của cách viết.
Dựa trên công nghệ hiện đại, cần xác định ra các quy trình nghiên cứu và làm việc mới có liên quan tới chữ Nôm và CNTT để tạo ra nề nếp và thói quen nghiên cứu mới. Các nghiên cứu này thường bao giờ cũng phải bắt đầu bằng việc tổng hợp mọi thông tin có được trong kho theo các chủ đề nghiên cứu, để rồi từ đó người nghiên cứu rút ra các nhận định, các ý kiến riêng của mình. Những thông tin mới về chữ Nôm, những phát kiến mới về việc thiết lập tương ứng giữa hình chữ và âm đọc cần được đưa vào máy tính lưu giữ theo những quy trình thống nhất để có thể phục vụ được cho nhiều người khác cùng tham khảo và nghiên cứu. Do đó, việc xây dựng các chuẩn về tư liệu, về biểu diễn văn bản chữ Nôm trở thành quan trọng và cần thiết.
Các triển vọng bảo tồn, khai thác chữ Nôm
Nhờ CNTT, các tài liệu cổ viết bằng chữ Nôm sẽ tránh được nguy cơ mai một và biến mất. |
Lấy chủ đề là triển khai ứng dụng CNTT phục vụ cho việc bảo tồn và phát huy các giá trị văn hoá trong chữ Nôm, chúng ta đã thấy rõ thực chất của vấn đề này là tạo ra mặt bằng làm việc cao hơn, với nhiều yếu tố kỹ nghệ và công nghệ áp dụng vào khoa học xã hội. Do đó có thể nói ứng dụng CNTT vào các vấn đề chữ Nôm là một hoàn cảnh, một thời cơ mới để thúc đẩy việc đưa các phương pháp nghiên cứu mới dựa trên CNTT vào các cơ sở nghiên cứu, cơ sở bảo tàng và thư viện. Thực chất đây chính là việc xây dựng hạ tầng cơ sở CNTT: phần cứng (máy móc, mạng), phần mềm (chương trình, dữ liệu), con người (tư duy mới, cách làm việc mới) và tổ chức (quy trình làm việc trên nền công nghệ).
Chính các yêu cầu phát triển nội tại của các vấn đề chữ Nôm đặt ra và thúc đẩy các nghiên cứu của CNTT, yêu cầu ứng dụng và phát triển các công nghệ mới nhất. Đòi hỏi của thực tế cũng yêu cầu CNTT phải đáp ứng cho các nhu cầu của cuộc sống thường ngày như in ấn chữ Nôm. Đây là khía cạnh xã hội hoá chữ Nôm qua máy tính. Những yêu cầu này quy tụ lại thành các chủ đề chính cho CNTT như sau:
Lập kho chuẩn e-Nôm - dạng biểu diễn điện tử cho các tài liệu chữ Nôm, là yêu cầu thiết yếu để có thể triển khai các hoạt động bảo tồn và nghiên cứu đối với chữ Nôm. Sở dĩ gọi là kho chuẩn bởi vì cách tổ chức dữ liệu cần tuân theo các chuẩn quốc tế để về sau việc trao đổi thông tin chữ Nôm có thể thực hiện được trên toàn cầu. Kho e-Nôm được tổ chức theo hai cơ sở dữ liệu lớn: cơ sở dữ liệu chữ Hán-Nôm và cơ sở dữ liệu các văn bản Hán-Nôm cổ.
Cơ sở dữ liệu chữ Hán-Nôm, ngoài phần đã được đăng ký với quốc tế, còn có phần các chữ của riêng Việt Nam mới được phát hiện ra và chưa kịp đăng ký với quốc tế. Cơ sở dữ liệu chữ này được mã hoá theo chuẩn quốc tế. Nhiều thông tin liên quan tới đặc thù chữ Nôm cũng được lưu giữ ở đây. Cơ sở dữ liệu này được xây dựng ra phục vụ chung cho cộng đồng nghiên cứu và có các công cụ xây dựng, tìm kiếm, trích rút thông tin.
Cơ sở dữ liệu thứ hai là kho các văn bản Hán-Nôm cổ được đưa vào máy tính. Các văn bản này tôn trọng nguyên dạng đã có của các văn bản cổ, nhưng cho phép truy nhập vào từng câu từng chữ để thực hiện so sánh, đối chiếu, tổng hợp. Ngoài việc các chữ được mã hoá theo chuẩn quốc tế, toàn bộ văn bản được tổ chức lưu giữ theo chuẩn XML để thể hiện các khía cạnh ngữ nghĩa của văn bản và để giúp cho việc tìm kiếm thuận lợi về sau..
Một khi cơ sở dữ liệu e-Nôm đã được xây dựng ra, bao gồm hai thành phần như đã nêu trên, người sử dụng trên khắp thế giới có thể truy nhập được vào chúng để trích rút những thông tin mình cần. Cụ thể, người sử dụng có thể dùng các công cụ được thiết lập trên máy tính để:
· Tra cứu tìm ngữ cảnh của các chữ Nôm
· Đối sánh tư liệu chữ Nôm để tìm dị biệt
· Thống kê tổng hợp các dạng chữ Nôm trong mọi văn bản
· Lưu trữ các cách diễn giải các chữ Nôm
Trước mắt, kho tư liệu văn bản chữ Nôm sẽ được xây dựng với việc đưa vào máy tính phần lớn các bản Truyện Kiều đã được công bố, dự kiến khoảng trên mười bản như vậy.
Việc lưu trữ tất cả các văn bản Kiều này cho phép xem xét tổng thể tất cả các dạng tồn tại của Truyện Kiều để từ đó xác định logic nội tại của tác phẩm. Qua việc đối chiếu các bản in theo từng từ có thể rút ra những nhận xét về những điểm chung hay riêng. Công việc này trước đây đã được các nhà nghiên cứu Nguyễn Tài Cẩn và Đào Thái Tôn thực hiện thủ công.
Trên cơ sở thống nhất của một số bản Kiều có thể tự động suy luận các phiên âm cho bản khác.
Từ kho tư liệu điện tử này, máy tính có thể nêu ra các gợi ý cách đọc của các từ còn chưa đọc được trong các văn bản khác.
Triển khai các công nghệ mới
Thư pháp chữ Nôm một nét, nghệ thuật mang đậm bản sắc văn hoá Việt. |
Công nghệ tra cứu văn bản Hán-Nôm có thể được thực hiện bằng các công cụ tra cứu quốc tế như Google. Một khi các văn bản được mô tả theo dạng chuẩn thì chúng ta hoàn toàn có thể dùng các công cụ tra cứu và tìm kiếm quốc tế đã có sẵn phục vụ cho mục đích của mình mà không phải tự mình phát triển các công cụ tra cứu riêng biệt. Việc tận dụng các thành quả phần mềm quốc tế sẽ giúp cho sự hoà nhập của kho tư liệu chúng ta vào kho tư liệu quốc tế chung và giúp cho nhiều người tiếp cận tới được.
Công nghệ phân tích văn phạm tự động đã tồn tại trên thế giới và đã có những ứng dụng rất thành công trong lĩnh vực y tế, trong việc chuyển từ các chẩn đoán, đơn thuốc của bác sĩ thành cơ sở dữ liệu sức khoẻ của bệnh viện. Công nghệ này có thể áp dụng được cho các văn bản Nôm và quốc ngữ để thúc đẩy các nghiên cứu về ngữ pháp tiếng Việt theo hướng có sự trợ giúp của máy tính.
Ngoài việc tận dụng các phần mềm quốc tế trong việc tổ chức, tra cứu thông tin văn bản, chúng ta cũng cần phát triển các phần mềm nguồn mở cho chữ Nôm trong những lĩnh vực đặc thù. Do vậy phần mềm nguồn mở phục vụ chữ Nôm cần trở thành một chủ đề cho giới CNTT phát triển. Cần động viên nhiều nhóm làm phần mềm phát triển kĩ thuật mới phục vụ cho nghiên cứu khoa học xã hội.
Nhu cầu trở về với văn hoá dân tộc là động lực chính cho chữ Nôm trường tồn. Chừng nào người Việt Nam còn yêu mến thiết tha với những di sản quá khứ thì còn có người ham thích tìm hiểu và học chữ Hán-Nôm. Tiến bộ CNTT hiện nay đã và đang hỗ trợ một cách hữu hiệu cho việc bảo tồn và phổ biến chữ Nôm.
Lời kết
Cuốn từ điển Hán - Nôm cổ nhất Việt Nam. |
Nhu cầu của các cơ sở văn hoá trong nước và quốc tế trong việc quản lý và khai thác tài liệu chữ Nôm là động lực thúc đẩy các nghiên cứu hiện đại về chữ Nôm. Những nghiên cứu này đòi hỏi phải được thực hiện trên nền CNTT hiện đại và tạo ra mặt bằng làm việc mới, cao cấp hơn trước. Nghiên cứu về chữ Nôm không tách rời với những công cụ và phương pháp mới mà CNTT đem lại.
Việc thay đổi phương pháp luận nghiên cứu, sử dụng CNTT làm công cụ nghiên cứu chữ Nôm và khoa học xã hội là xu hướng phát triển của thời kỳ mới. Việc này cần được thúc đẩy và phổ biến rộng rãi cho các ngành khoa học xã hội.
Hạ tầng cơ sở CNTT cho chữ Nôm nói riêng, khoa học xã hội nói chung, bao gồm dữ liệu, tri thức và con người có kỹ năng mới cần phải được phát triển một cách có chiến lược, có đầu tư. Các cấp lãnh đạo cần coi việc xây dựng hạ tầng cơ sở CNTT cho đơn vị mình là một trong những nhiệm vụ quản lý chủ chốt.
-
Ngô Trung Việt (Viện Công nghệ Thông tin)