Gần đây, giáo sư Qin Shuo đã tham gia triển lãm CES tại Las Vegas.
Trong suốt chuyến đi Mỹ, mặt sau điện thoại của ông luôn dán một "vũ khí bí mật" — thẻ ghi âm DingTalk A1. Ông dùng nó để ghi lại cảm hứng trong lúc ăn uống, nắm bắt trọng tâm khi phỏng vấn cấp cao, theo dõi thông tin tại buổi họp báo. Từ sáng đến tối, từ đơn giản đến phức tạp, đâu đâu cũng thấy bóng dáng thiết bị này.
Cùng xem trải nghiệm chia sẻ của ông.
Câu chuyện ngại ngùng giữa tôi và máy ghi âm
Từ năm 1990 khi bước chân vào ngành truyền thông, máy ghi âm đã trở thành vật dụng thiết yếu hàng ngày của tôi. Ban đầu là chiếc máy cassette to như cục gạch, dùng băng TDK; sau đó là máy thu nhỏ gọn hơn cả điện thoại di động, dùng băng nhỏ. Mỗi lần ghi âm xong đều phải phát lại nhiều lần và chép từng câu một.
Sự nghiệp của tôi gắn liền với các thiết bị ghi âm như vậy.
Dù khả năng biên tập và xử lý nội dung của tôi khá ổn, nhưng trong việc thao tác công cụ thì thường lúng túng. Ngay cả những máy ghi âm cấu tạo đơn giản, chỉ vài nút như ghi âm, dừng, tua nhanh, tua ngược, phát lại… tôi vẫn hay bấm nhầm.
Trường hợp ngại nhất xảy ra vào năm 1993, khi tôi đại diện cho tạp chí Nan Feng Chuang tiến hành phỏng vấn chung với thị trưởng Quảng Châu lúc bấy giờ là ông Li Ziliu. Phóng viên Xinhua hỏi chính, tôi phụ trách ghi âm và ghi chú. Không biết bấm nhầm nút nào, một lúc sau thấy băng máy ghi âm phồng ra ngoài. May mắn là thị trưởng không phát hiện, tôi vội vàng nhét máy vào túi và nhấn nút dừng.
Sau khi về nghe lại, phần lớn nội dung không được ghi âm. Tôi đành nhờ phóng viên truyền hình, viện cớ cần đối chiếu phiên bản, mới bổ sung được nội dung. Việc này để lại ám ảnh tâm lý lâu dài cho tôi.
Từ đó về sau, dù dùng máy ghi âm, bút ghi âm, sổ thông minh hay điện thoại, tôi luôn không nhịn được kiểm tra trạng thái ghi âm liên tục. Với những cuộc phỏng vấn quan trọng, thậm chí còn dùng hai điện thoại cùng lúc mới yên tâm.
Cho đến một ngày tình cờ đọc sách giáo khoa đại học của con gái, tôi đọc được cuốn Tâm lý học thiết kế của Norman, cuối cùng cũng được giải tỏa. Trong sách viết rằng: khi sản phẩm có vấn đề, người dùng thường đổ lỗi cho bản thân, nhưng nguyên nhân thực sự lại nằm ở khuyết điểm thiết kế. “Lỗi thao tác không nên đổ lỗi cho người dùng, mà do sản phẩm và thiết kế.”
Thì ra, không phải lỗi của tôi!
Dù tinh thần nhẹ nhõm hơn, nhưng trên thực tế vẫn khó tìm được thiết bị ghi âm thật sự “lấy người dùng làm trung tâm”, có tính “khả kiến” và “dễ hiểu”. Đặc biệt hiện nay nhiều cuộc phỏng vấn bằng tiếng Anh, cộng thêm yêu cầu thời đại自媒体 đòi hỏi chỉnh sửa và phát hành nhanh chóng, áp lực vẫn tồn tại.
Phụ kiện AI: Trải nghiệm lần đầu với thẻ ghi âm DingTalk A1
Cho đến gần đây khi tham gia CES (Triển lãm Điện tử Tiêu dùng), sử dụng thẻ ghi âm AI DingTalk (DingTalk A1), tôi mới hoàn toàn thoát khỏi nỗi lo ghi âm. Thiết bị này dán phía sau điện thoại, hỗ trợ ghi âm thông minh, tổng hợp nội dung, dịch thuật thời gian thực 8 ngôn ngữ và thông dịch đồng thanh hơn 20 ngôn ngữ. Ngay cả trong môi trường ồn ào như chợ cá, vẫn nghe rõ, ghi được, dịch chuẩn và tóm tắt tốt, trở thành “phụ kiện AI” đầu tiên của tôi.
Từ thời đại analog với máy cassette nặng nề, đến nay là thẻ ghi âm AI chỉ nặng 40 gram; từ việc thủ công chỉnh sửa sang chuyển đổi tự động, tinh lọc và sinh bản ghi, sự tiến hóa này phản ánh rõ ràng quá trình cá nhân tôi trải qua từ tin học hóa, số hóa đến trí tuệ hóa.
AI cần có “thân xác”
Lúc 11:49 sáng ngày 4 tháng 1, tôi lên chuyến bay UA2229 từ Los Angeles đến Las Vegas. Trong phòng chờ, tôi mở hộp thẻ ghi âm AI DingTalk, thấy bên trong có thiết bị chính, ốp da và vòng nam châm. Dán vòng nam châm vào mặt sau điện thoại, đặt thiết bị chính lên là xong. Thiết bị chỉ có nút ghi âm và nút giọng nói, các thao tác khác thực hiện qua ứng dụng DingTalk. Tải ứng dụng, kích hoạt thiết bị, toàn bộ quá trình không cần hướng dẫn, rất dễ dàng.
Khi tôi dán thiết bị nhỏ bằng danh thiếp này lên điện thoại, một cặp vợ chồng nước ngoài ngồi cạnh tỏ vẻ tò mò hỏi. Tôi trả lời: “Cái này tôi chưa từng dùng, có thể ghi âm, dịch, chuyển thành văn bản.” Họ trầm trồ: “It’s so cool.”
Chủ đề CES năm nay chính là AI, xu hướng cốt lõi là chuyển từ “AI thông tin” sang “AI vật lý” — AI đang kết hợp với phần cứng, mang linh hồn trí tuệ vào thiết bị. Ví dụ kính AI giống như thêm “phụ đề tức thời” cho thế giới thực, còn thẻ ghi âm AI là tích hợp khả năng mô hình âm thanh lớn lên một tấm thẻ.
Hướng đi này được gọi là “muôn vật đều AI” hoặc “AI tiến về thiết bị đầu cuối” (Edge AI), cũng có người gọi là “tất cả đều có thể tính toán”. Tôi tóm tắt là “thiết bị đầu cuối hóa AI, AI hóa thiết bị đầu cuối”. Cùng với sự nâng cao năng lực mô hình lớn, AI đang tái tạo mọi phần cứng vật lý.
Thẻ ghi âm AI DingTalk tuy hình dạng như tấm thẻ, nhưng thực tế trang bị chip âm thanh AI 6nm, kèm 5 micrô đa hướng và 1 micrô truyền dẫn xương, hỗ trợ nhận dạng giọng nói và nhận dạng không gian, đạt được ghi âm trực quan. Dữ liệu ghi âm được mã hóa kép ở thiết bị và đám mây, đảm bảo an toàn, đồng thời hỗ trợ gọi thông minh AI.
Tại CES, tôi dùng thẻ ghi âm AI như thế nào?
Sáng ngày 5 tháng 1, lịch trình CES của tôi chính thức bắt đầu. Tôi tham dự buổi giới thiệu sản phẩm trước của Lenovo tại khách sạn Venetian, nhiều chuyên gia dùng tiếng Anh trình bày các sản phẩm tính toán thông minh cá nhân mới. Tôi ngồi hàng đầu bên phải khu vực khán giả, bục phát biểu cách khoảng 5-6 mét về bên trái. Bật thẻ ghi âm DingTalk và chức năng “dịch tức thời”, vừa ghi âm vừa xem bản gốc tiếng Anh và bản chuyển đổi tiếng Trung. Buổi giới thiệu nửa tiếng kết thúc, bản ghi AI và chương mục đã tự động tạo ra, nội dung có thể dùng trực tiếp trên DingTalk hoặc xuất tài liệu chia sẻ.
Trải nghiệm lần đầu rất tốt: chức năng phù hợp nhu cầu, thao tác đơn giản, tỷ lệ nhận dạng cao. Dù một vài thuật ngữ chuyên môn dịch sai, nhưng nếu cho phép nó học tư liệu của tôi, hiệu suất sẽ dần cải thiện. Tỷ lệ chính xác nhận dạng giọng nói truyền thống khoảng 70%, mô hình lớn phổ thông đạt 80%, còn DingTalk dựa vào phòng thí nghiệm Tongyi của Alibaba, được huấn luyện bởi 100 triệu giờ âm thanh-hình ảnh, độ chính xác đạt 90%, sau huấn luyện chuyên sâu có thể tăng lên 97%.
Trưa ngày 5, tham gia bữa trưa cùng các quản lý cấp cao của một công ty quan hệ công chúng New York tại nhà hàng ngoài trời. Môi trường ồn ào, năm người nói chuyện xen kẽ, nhưng thẻ ghi âm vẫn duy trì độ chính xác cao. Kết hợp chức năng “dịch tức thời”, hiệu suất tăng rõ rệt.
Sáng ngày 6, trao đổi với COO khu vực Bắc Á - Thái Bình Dương của một công ty nổi tiếng thế giới tại nhà hàng khách sạn khác. Môi trường trong nhà ồn ào, ba người nói chuyện, một số âm thanh mơ hồ, nhưng thẻ ghi âm ghi lại rõ ràng.
Cùng sáng hôm đó, phỏng vấn Giám đốc Đổi mới FIFA Johannes Holzmuller cùng bạn đồng nghiệp truyền thông. Môi trường yên tĩnh, chất lượng ghi âm và bản ghi AI càng tốt hơn.
Sau đó, sáng ngày 7, liên tiếp ba buổi phỏng vấn nhóm với các quản lý cấp cao Lenovo, tôi đã sử dụng thẻ ghi âm thành thạo. Yang Yuanqing nhắc đến, AI đang hiện diện khắp nơi, sau khi người dùng ủy quyền, agent AI trong thiết bị đầu cuối có thể phản hồi lệnh thậm chí hành động chủ động. Có lẽ không lâu nữa, các loại phần cứng sẽ chuyển từ “người thực thi thụ động” thành “người tham gia chủ động”.
Toàn bộ thời gian CES, tôi tích lũy ghi âm khoảng bảy đến tám giờ, mức tiêu hao pin dưới 30%. Theo thông tin, thời lượng pin lên tới 45 giờ, cổng Type-C có thể sạc bằng dây điện thoại, không hề lo lắng về pin.
Chiều ngày 7 tháng 1, tôi đặc biệt đến gian trưng bày DingTalk (số 22020) để cảm ơn. Kể từ khi dán lên điện thoại, tôi chưa từng tháo ra.
Với tôi, thiết bị này có ba ưu điểm lớn: thứ nhất, ghi âm rõ ràng ngay cả ở khoảng cách xa và môi trường ồn ào; thứ hai, hỗ trợ dịch tức thời và thông dịch đồng thanh, phù hợp với bối cảnh quốc tế; thứ ba, ghi âm xong chuyển đổi ngay thành văn bản và tự động tóm tắt, tiết kiệm đáng kể thời gian. Dù chưa hoàn hảo, nhưng khả năng của nó có thể tiếp tục tiến hóa theo quá trình sử dụng, khác biệt với phần cứng truyền thống có chức năng cố định.
Thời đại phần cứng AI mới đang đến
Thực tế, những chức năng tôi dùng chỉ là phần nổi của tảng băng.
Ví dụ, chức năng hỏi đáp AI tích hợp sẵn, có thể trả lời câu hỏi dựa trên cơ sở dữ liệu nội dung đã ghi. Với tài liệu dài, trước đây phải tìm kiếm đi tìm lại, giờ chỉ cần hỏi “Ai đã nói gì về vấn đề này”, câu trả lời lập tức hiện ra.
Lại như, nhiều tập tin ghi âm có thể hợp nhất tạo thành bản ghi tổng thể, đặc biệt phù hợp người dùng phỏng vấn đa nguồn, lượng ghi âm lớn.
Những chức năng này tôi chưa thử, chứng tỏ trong việc vận dụng công cụ kỹ thuật, tôi vẫn là “người chậm hiểu”.
Nhưng khác với quá khứ, “chim chậm hiểu” ngày nay có thể mượn sức AI để bay trước.
Với doanh nghiệp, giá trị của thẻ ghi âm AI DingTalk còn lớn hơn. Tại buổi ra mắt DingTalk AI 1.1, Hứa Tiếu Doanh của công ty Youcheng chia sẻ: ban đầu chủ tịch không hiểu vì sao phải trang bị thẻ ghi âm cho chuyến công tác Mexico, nhưng trong một cuộc họp Tây Ban Nha-Nhật Bản, thẻ ghi âm không chỉ dịch tức thời tiếng Tây Ban Nha, mà còn phát hiện thiếu sót bản dịch nhân công, nâng cao đáng kể chất lượng giao tiếp. Công ty lập tức trang bị toàn diện cho quản lý và nhân viên ngoại nhiệm.
Tại CES năm nay, tôi thấy rất nhiều thiết bị AI mới như nhẫn, vòng cổ, bông tai... Trọng tâm không còn là “có thể đeo”, mà là “có thể làm việc, có thể tương tác” — bạn nói một câu, nó có thể phản hồi. AI đang từ đám mây đi xuống thực tế, hòa nhập vào muôn vật.
Điều này nhờ vào sự phát triển nhanh chóng của mô hình lớn AI trong những năm gần đây, cùng với đột phá phối hợp năm công nghệ: chip, thuật toán, kiến trúc, cảm biến, truyền thông (như NPU + tích hợp tính toán-lưu trữ, mô hình lớn nhẹ, tích hợp đa cảm biến), khiến thiết bị di động qua mô hình “thu thập tại chỗ + tính toán trên điện thoại/đám mây” trở nên cực kỳ thông minh.
Theo dự báo của Frost & Sullivan, từ năm 2025 đến 2029, quy mô thị trường phần cứng AI đầu cuối toàn cầu sẽ tăng vọt từ 321,9 tỷ nhân dân tệ lên 1.220 tỷ, tốc độ tăng trưởng kép hàng năm đạt 40%, vượt xa điện tử tiêu dùng truyền thống.
Dù đối mặt với thiếu dữ liệu chuyên biệt, chi phí tính toán cao, phụ thuộc mạng... lợi thế lớn nhất của phần cứng AI là khả năng cập nhật nhanh nhờ tích hợp phần mềm-phần cứng. Ví dụ robot hình người tại giải bán marathon Bắc Kinh năm ngoái còn chưa thể đi thẳng, vài tháng sau đã có thể làm việc. NVIDIA còn rút ngắn chu kỳ cập nhật kiến trúc GPU AI từ hai năm xuống một năm, đẩy nhanh tiến hóa “bộ não robot”.
DingTalk với tư cách nền tảng văn phòng hợp tác lớn nhất Trung Quốc, có 26 triệu tổ chức và 700 triệu người dùng cá nhân, các kịch bản làm việc, họp, giao tiếp phong phú này cung cấp nền tảng dồi dào cho đổi mới phần cứng AI. Thẻ ghi âm DingTalk do đó trở thành phần cứng tiêu dùng trọng điểm của Alibaba hướng tới thời đại AI.
Sản phẩm này phía sau tận dụng năng lực tính toán Alibaba và mô hình lớn Tongyi. Việc DingTalk bố cục trên phần cứng thông minh hàng ngàn ngành nghề, cũng liên quan đến việc mô hình lớn Alibaba có thể được “tiêu dùng” rộng rãi hay không.
Kết luận
Sản xuất Trung Quốc đã có năng lực cạnh tranh mạnh mẽ trong chuỗi cung ứng. Hiện nay, là thời điểm tích hợp AI vào mọi loại phần cứng. Điều này sẽ thúc đẩy “sản xuất” tiến lên “trí tạo”, không chỉ sản xuất thông minh, mà còn sản xuất bản thân phần cứng thông minh.
Trong quá trình này, các siêu ứng dụng Internet và công ty mô hình lớn lần lượt tham gia “sinh thái hóa thiết bị đầu cuối”. Ngoài DingTalk, các gã khổng lồ khác cũng đang khám phá các hình thức như thiết bị đầu cuối doanh nghiệp AI giọng nói, phần cứng hội nghị/dịch vụ khách hàng thông minh, thiết bị nhúng xuyên sinh thái...
Mục tiêu của DingTalk là thông qua phối hợp phần mềm-phần cứng, hoàn thiện vòng khép kín từ bắt nhiệm vụ, phân tích nội dung đến hợp tác thực thi, giúp tổ chức lưu giữ tài sản dữ liệu bằng phần cứng ai cũng dùng được, giải phóng giá trị AI. Đây là định hướng toàn diện xuyên suốt phần mềm, AI, phần cứng và dịch vụ doanh nghiệp, tiềm năng vô hạn.
Từ tấm thẻ ghi âm nhỏ bé này, tôi nhìn thấy một thời đại phần cứng AI mới vĩ đại đã đến, dựa vào lợi thế sản xuất, chuỗi cung ứng Trung Quốc cùng quy mô tổ chức lớn và các kịch bản ứng dụng phong phú.
Điều này cũng báo hiệu, bức màn thời đại Internet mới đã được kéo lên, khi Internet di động chuyển sang kỷ nguyên tích hợp thể thông minh và phần cứng thông minh.
|Tác giả: Qin Shuo
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at
Using DingTalk: Before & After
Before
- × Team Chaos: Team members are all busy with their own tasks, standards are inconsistent, and the more communication there is, the more chaotic things become, leading to decreased motivation.
- × Info Silos: Important information is scattered across WhatsApp/group chats, emails, Excel spreadsheets, and numerous apps, often resulting in lost, missed, or misdirected messages.
- × Manual Workflow: Tasks are still handled manually: approvals, scheduling, repair requests, store visits, and reports are all slow, hindering frontline responsiveness.
- × Admin Burden: Clocking in, leave requests, overtime, and payroll are handled in different systems or calculated using spreadsheets, leading to time-consuming statistics and errors.
After
- ✓ Unified Platform: By using a unified platform to bring people and tasks together, communication flows smoothly, collaboration improves, and turnover rates are more easily reduced.
- ✓ Official Channel: Information has an "official channel": whoever is entitled to see it can see it, it can be tracked and reviewed, and there's no fear of messages being skipped.
- ✓ Digital Agility: Processes run online: approvals are faster, tasks are clearer, and store/on-site feedback is more timely, directly improving overall efficiency.
- ✓ Automated HR: Clocking in, leave requests, and overtime are automatically summarized, and attendance reports can be exported with one click for easy payroll calculation.
Operate smarter, spend less
Streamline ops, reduce costs, and keep HQ and frontline in sync—all in one platform.
9.5x
Operational efficiency
72%
Cost savings
35%
Faster team syncs
Want to a Free Trial? Please book our Demo meeting with our AI specilist as below link:
https://www.dingtalk-global.com/contact

Tiếng Việt
English
اللغة العربية
Bahasa Indonesia
Bahasa Melayu
ภาษาไทย
简体中文 