Một số trang công nghệ đưa tin một nữ kĩ sư của công ty Google đã tính được một số Pi (kí hiệu là π) kỉ lục, dài 31 triệu triệu (trillion, theo tiếng Anh – Mỹ). Số Pi là hằng số toán học, có giá trị bằng tỷ số chu vi đường tròn với đường kính đường tròn, tương đương 3,1415…

Bài báo cũng nói thêm là, hiện tại chúng ta chỉ cần dùng vài chục con số (digit) ở phần thập phân là đủ.

  • Outside of bragging rights, the 9 trillion extra digits are unlikely to have too many real-world uses. NASA only uses around 15 digits of pi to send rockets into space… (Tạm hiểu, 9 triệu triệu chữ số thập phân thừa không có nhiều giá trị thực tế. NASA chỉ cần sử dụng 15 chữ số thập phân của Pi để tính toán cho việc phóng tên lửa vào không gian.)

Tính toán “chi li” là như vậy, mà chắc gì đã đo chính xác được, cũng khó ai có thể kiểm chứng được. Ai đo được cái mà NASA làm? Những thứ này đa phần là để làm truyền thông cho những hệ thống tính toán của các hãng công nghệ. Ở đây là quảng cáo gián tiếp cho sức mạnh của hệ thống dịch vụ “cloud-based compute engine” mà Google đang triển khai. Rồi đây tất cả sẽ được đưa lên “mây” và “đám mây” sẽ bị kéo về Việt Nam phải không các bạn?

Có một điều khá nực cười là, trong lĩnh vực công nghệ là đua mà không biết khi nào sẽ tới cái đích cuối cùng. Tin vào cái vật chất không giới hạn, trong khi nó rất là giới hạn. Đó là cuộc đua rất căng thẳng, thú vị và mệt mỏi. Thầy đoán cuộc đua này sẽ kết thúc khi nền văn minh này kết thúc, và nền văn mình này sẽ kết thúc giống như cái kết của những nền văn minh từng tìm ra số Pi. Dễ biết thôi, trong động từ “develop” có “de“, và trong động từ “improve” cũng chứa “im“. Nghĩ vui kiểu chơi chữ là như vậy.

Có bao giờ bạn để ý việc hệ điều hành điện thoại thông minh luôn có những bản cập nhật và nâng cấp định kì, sau khi người dùng nâng cấp vài lần thì phải mua luôn máy mới vì máy cũ chạy không nổi, trong khi nhu cầu sử dụng gần như không đổi. Từ khi có sản xuất hàng loạt (mass production), người dùng có thêm nhiều thứ tiện ích, và cũng phải “nuôi lại” nó tương đương với những thứ mà nhận được.

Giữa những sự cố máy bay hiện đại bị rơi do lỗi kĩ thuật trong những ngày gần đây, tổng thống Hoa Kì Donald Trump có đăng lên Twitter một “trạng thái” rất đáng suy nghĩ:

  • Plilots are no longer needed, rather computer scientists from MIT.
  • Always seeking to go one unnecessary step further, when often old and simpler is far better.

Các bạn hiểu 2 câu này (đặt trong ngữ cảnh) là thế nào?

Có một chút liên quan ở đây. Nếu các bạn để ý thì sẽ thấy thầy rất hay đề cập đến ngữ liệu, vì thầy cho rằng nó chính là nền tảng giải quyết mọi vấn đề của giáo dục ngôn ngữ. Khái niệm này không phải là mới, trong ngôn ngữ học nó cũng đã được nhắc tới và nghiên cứu nhiều lần. Tuy nhiên, vấn đề đặt ra là ngữ liệu phải lớn như thế nào? Ngữ liệu phải dài bao nhiêu trillion từ? Hay là trillion của triệu triệu trillion? Vô cực trillion chăng?

Thầy nói rằng không. Cũng giống như số Pi vậy, hiện tại, chỉ cần từ 15-40 chữ số thập phân là đủ dùng, thì ngữ liệu cũng chỉ cần bao nhiêu chữ? là đủ dùng. Nhiều ngữ liệu quốc tế, độ lớn đã lên tới hàng tỷ từ, ngày càng tinh vi và phức tạp, làm việc xử lý rất khó khăn, đòi hỏi những hệ thống máy tính cấu hình cực mạnh. Tuy nhiên, mấu chốt nằm ở chỗ tinh chọn và tinh chất chứ không phải là gom hết tất cả mọi thứ linh tinh vào rồi mất công xử lý.

Trong lĩnh vực giáo dục ngôn ngữ, ngữ liệu sẽ giúp dạy đúng cái cần dạy và học đúng cái cần học, và để đạt được điều này, thì đầu tiên là phải xây dựng được ngữ liệu cốt lõi. Hiện tại, nhiều cơ sở dữ liệu ngôn ngữ, nhiều bộ ngữ liệu công khai chưa được xây dựng tinh chấttập trung, do đó cũng không giải quyết được vấn đề học đúng.

Nhưng học đúng có cần thiết? Học đúng chỉ dành cho một nhóm nhỏ. Nó không dành cho đa số người học, vì sao? Vì đa số người học phải phục vụ cho nền giáo dục hiện đại, cái đã và đang đi vào con đường mass production với những hệ thống khổng lồ. Hiển nhiên là vì “đại cuộc”, phải chấp nhận hi sinh cái đúng để duy trì hệ thống giáo dục khổng lồ và ngày càng phình to.