Trong đó, RAG là một kỹ thuật trong AI, kết hợp khả năng "truy xuất" (Retrieval) thông tin từ một nguồn dữ liệu bên ngoài (có thẩm quyền và cập nhật) với khả năng "tạo sinh" (Generation) văn bản của một mô hình ngôn ngữ lớn (LLM).
Phát triển phần mềm khai thác RAG
Công ty cũng đã tự phát triển phần mềm tìm kiếm cơ sở dữ liệu có tên "KIOXIA AiSAQ (All-in-Storage Approximate nearest neighbor search with product Quantization, tạm dịch là tìm kiếm nhanh chóng và gần đúng các mục tương tự nhau trong một tập dữ liệu rất lớn)", sau đây gọi tắt là AiSAQ.
Việc sử dụng AiSAQ cho phép triển khai RAG với cơ sở dữ liệu lớn hơn so với các phương pháp hiện có. Nhờ đó, độ chính xác đầu ra của AI tạo sinh được cải thiện và, theo công ty, “việc sử dụng AI tạo sinh trong kinh doanh sẽ trở nên phổ biến hơn”. AiSAQ đã được phát hành dưới dạng mã nguồn mở và có thể sử dụng không chỉ với SSD của Kioxia mà còn tương thích với sản phẩm của các đối thủ.
Cơn sốt AI đang gia tăng mạnh mẽ nhờ sự xuất hiện của AI tạo sinh dựa trên các LLM. Ngành công nghiệp bán dẫn cũng hưởng lợi lớn từ xu hướng này, với doanh số GPU (bộ xử lý đồ họa) và DRAM băng thông cao (HBM) tăng vọt. Đây là hai thành phần thiết yếu cho quá trình huấn luyện AI.
Trong lĩnh vực GPU, Nvidia của Mỹ đang dẫn đầu, còn trong HBM, SK hynix của Hàn Quốc đang thể hiện vị thế vượt trội. Tuy nhiên, vẫn còn nhiều nhà sản xuất bán dẫn không theo kịp làn sóng AI này và trong đó có Kioxia, vốn hoạt động trong lĩnh vực bộ nhớ flash và sản phẩm SSD ứng dụng từ đó.
Kioxia dự đoán: “Tình trạng chỉ một số ít nhà sản xuất bán dẫn như Nvidia hay SK hynix nổi bật sẽ thay đổi trong tương lai”. AI tạo sinh đã mở rộng phạm vi ứng dụng AI từ nhận diện hình ảnh sang việc tạo hình ảnh, tạo văn bản. Hơn nữa, giao diện người – máy (HMI) đã trở nên thân thiện hơn, cho phép nhập liệu bằng ngôn ngữ tự nhiên, giúp AI đến gần hơn với đại chúng.
Tuy nhiên, AI vẫn có nguy cơ tạo ra thông tin sai lệch do suy diễn (còn gọi là “ảo giác” – hallucination). Dù đầu ra của AI có thể hữu ích như một tài liệu tham khảo, thì việc sử dụng cho mục đích kinh doanh vẫn tiềm ẩn rủi ro.
Kioxia nhận thấy cơ hội để bứt phá
Phương pháp suy luận sử dụng RAG là một cách để giảm thiểu hiện tượng "ảo giác" và nâng cao độ chính xác của kết quả AI. Với RAG, việc suy luận được thực hiện dựa trên một cơ sở dữ liệu chứa thông tin chuyên biệt hoặc tùy chỉnh theo từng người dùng, từ đó cải thiện độ chính xác. Chính trong giai đoạn RAG ngày càng phổ biến này mà Kioxia nhận thấy cơ hội để bứt phá. Bởi lẽ, trước đây dữ liệu của RAG thường được lưu trữ trên DRAM, nhưng trong tương lai, xu hướng sẽ chuyển dịch nhanh sang SSD và Kioxia đưa ra nhiều lý do để giải thích điều đó.
Ví dụ, cơ sở dữ liệu chuyên biệt dùng cho RAG sẽ tiếp tục mở rộng nhằm cải thiện độ chính xác đầu ra trong nhiều lĩnh vực khác nhau. Kết quả huấn luyện từ AI tạo sinh có thể được xem là cơ sở dữ liệu dùng chung, nhưng cơ sở dữ liệu RAG sẽ ngày càng lớn khi phạm vi ứng dụng được mở rộng. Việc lưu trữ lượng dữ liệu lớn như vậy bằng DRAM là điều khó khăn, nên SSD sẽ đóng vai trò chủ chốt.
Ngoài ra, việc tận dụng dữ liệu IoT (Internet vạn vật) chưa được khai thác cũng sẽ thúc đẩy nhu cầu SSD. Các công ty đã thu thập được lượng lớn dữ liệu IoT từ trước thời kỳ bùng nổ AI, nhưng đến nay vẫn chưa có cách khai thác hiệu quả. Việc sử dụng dữ liệu đó làm cơ sở dữ liệu cho RAG sẽ giúp nâng cao độ chính xác trong suy luận của AI.
Thêm vào đó, Kioxia cho biết tần suất suy luận diễn ra nhiều hơn rất nhiều so với việc huấn luyện AI – đây cũng là một lý do SSD sẽ được dùng rộng rãi hơn. Nói cách khác, số lượng hệ thống thực hiện suy luận vượt xa số lượng hệ thống thực hiện huấn luyện, nên nếu SSD được ứng dụng vào khâu suy luận, nhu cầu thị trường sẽ bùng nổ.
Kioxia đang phát hành AiSAQ dưới dạng mã nguồn mở. Điều này đồng nghĩa phần mềm có thể được sử dụng không chỉ với SSD của chính họ, mà còn với sản phẩm của các đối thủ như Samsung Electronics và SK hynix (Hàn Quốc), hay Western Digital (Mỹ). Lý do khiến Kioxia chọn mã nguồn mở là để “góp phần mở rộng thị trường SSD dành cho AI tạo sinh”. Nếu AiSAQ trở thành tiêu chuẩn ngành cho phần mềm RAG, mức độ nhận diện thương hiệu của Kioxia sẽ được nâng cao, và công ty kỳ vọng sẽ giành được lợi thế trên thị trường SSD dành cho AI trong tương lai.
Tiền thân của Kioxia là bộ phận bộ nhớ của tập đoàn Toshiba. Điều đáng chú ý là Toshiba, thông qua kỹ sư Fujio Masuoka, chính là công ty đã phát minh ra bộ nhớ flash vào năm 1980 và sau đó là bộ nhớ NAND flash đầu tiên trên thế giới vào năm 1987. Phát minh này đã thay đổi hoàn toàn ngành công nghiệp lưu trữ dữ liệu, mở đường cho sự phát triển của smartphone, SSD và các trung tâm dữ liệu hiện đại.
Năm 2018, do những khó khăn tài chính và tái cấu trúc, bộ phận bộ nhớ của Toshiba đã được tách ra và đổi tên thành Toshiba Memory Corporation.. Vào năm 2019, Toshiba Memory Holdings Corporation chính thức đổi tên thành Kioxia Holdings Corporation. Cái tên "Kioxia" là sự kết hợp của từ tiếng Nhật "kioku" (bộ nhớ) và từ tiếng Hy Lạp "axia" (giá trị), thể hiện sứ mệnh của công ty là tạo ra giá trị cho thế giới thông qua công nghệ bộ nhớ.
Kioxia là một trong những nhà sản xuất bộ nhớ NAND flash lớn nhất thế giới, thường xuyên giữ vị trí thứ 2 hoặc thứ 3 về thị phần doanh thu toàn cầu, cạnh tranh trực tiếp với Samsung, Western Digital, SK Hynix và Micron.
Anh Tú