2025-07-24 Top Stories #
- Qwen3-Coder-480B-A35B-Instruct là một mô hình hỗn hợp chuyên gia với 480B tham số, hỗ trợ độ dài ngữ cảnh dài và thể hiện xuất sắc trong mã hóa đại diện (agent coding) và sử dụng công cụ.
- Ca sĩ chính của Black Sabbath, Ozzy Osbourne, qua đời ở tuổi 76, gia đình ông đã thông báo tin này, và những người trong giới âm nhạc đã bày tỏ lòng kính trọng.
- Trình soạn thảo mã Zed đã thêm tính năng mới, cho phép người dùng tắt tất cả các tính năng AI, tăng cường hơn nữa khả năng bảo vệ quyền riêng tư và trải nghiệm tùy chỉnh của người dùng.
- Trải nghiệm sử dụng Volvo EX90 của người dùng tràn ngập các vấn đề về chất lượng, bao gồm lỗi hệ thống và tranh chấp dịch vụ, cuối cùng dẫn đến hành động pháp lý.
- Bài viết giải thích chi tiết nguyên lý hoạt động của băng trò chơi Game Boy, bao gồm thiết kế, hiệu năng và chuỗi công cụ phát triển của nó.
- GrapheneOS được sử dụng trong điện thoại Google Pixel vì các tính năng bảo mật và quyền riêng tư mạnh mẽ của nó, nhưng việc sử dụng nó trong tội phạm đã gây ra tranh cãi.
- Cerebras đã ra mắt mô hình Qwen3-235B, hỗ trợ 1.5k token mỗi giây và độ dài ngữ cảnh 131K, cải thiện đáng kể hiệu suất suy luận AI.
- Hệ thống Cảnh báo Động đất Android sử dụng gia tốc kế điện thoại thông minh để phát hiện động đất và cung cấp cảnh báo sớm, đã hoạt động ở 98 quốc gia.
- Swift-Erlang-Actor-System cho phép các chương trình Swift tham gia vào các cụm Erlang phân tán, cung cấp một ví dụ chương trình trò chuyện đơn giản.
- Khi sử dụng Gemini CLI, tác giả đã gặp phải vấn đề mất tệp nghiêm trọng, chủ yếu do Gemini diễn giải sai các lệnh và thiếu cơ chế xác thực.
Qwen3-Coder: Lập trình dựa trên Agent trong thế giới thực #
Qwen3-Coder: Agentic coding in the world
https://qwenlm.github.io/blog/qwen3-coder/
Hôm nay, chúng tôi xin giới thiệu mô hình mã hóa có tính đại diện cao nhất từ trước đến nay – Qwen3-Coder. Qwen3-Coder cung cấp nhiều phiên bản với các quy mô khác nhau, nhưng trước tiên chúng tôi sẽ giới thiệu biến thể mạnh mẽ nhất của nó: Qwen3-Coder-480B-A35B-Instruct, một mô hình hỗn hợp chuyên gia với 480B tham số, trong đó 35B tham số hoạt động, hỗ trợ gốc độ dài ngữ cảnh 256K token và có thể mở rộng lên đến 1M token thông qua phương pháp ngoại suy, thể hiện hiệu suất vượt trội trong cả nhiệm vụ mã hóa và nhiệm vụ đại diện. Qwen3-Coder-480B-A35B-Instruct đã đạt được thành tích cao nhất mới trong Agentic Coding, Agentic Browser-Use và Agentic Tool-Use trong số các mô hình mở, tương đương với Claude Sonnet 4.
Ngoài mô hình, chúng tôi còn mở mã nguồn một công cụ dòng lệnh để mã hóa đại diện: Qwen Code. Qwen Code được phân nhánh từ Gemini Code, thông qua các gợi ý tùy chỉnh và giao thức gọi hàm, phát huy tối đa khả năng của Qwen3-Coder trong các nhiệm vụ mã hóa đại diện. Qwen3-Coder hợp tác liền mạch với các công cụ phát triển tốt nhất trong cộng đồng. Là một mô hình cơ bản, chúng tôi hy vọng nó có thể được sử dụng ở bất cứ đâu trong thế giới kỹ thuật số – Agentic Coding in the World!
Về mặt tiền huấn luyện, chúng tôi đã thúc đẩy thông qua nhiều chiều để tăng cường khả năng cốt lõi của mô hình:
- Mở rộng token: 7.5T token (tỷ lệ mã 70%), đồng thời duy trì khả năng chung và toán học, đồng thời xuất sắc trong mã hóa.
- Mở rộng ngữ cảnh: Hỗ trợ gốc ngữ cảnh 256K và có thể mở rộng lên đến 1M thông qua YaRN, được tối ưu hóa cho quy mô kho lưu trữ và dữ liệu động (ví dụ: Pull Requests) để tăng cường mã hóa đại diện.
- Mở rộng dữ liệu tổng hợp: Sử dụng Qwen2.5-Coder để làm sạch và viết lại dữ liệu nhiễu, cải thiện đáng kể chất lượng dữ liệu tổng thể.
Về mặt hậu huấn luyện, chúng tôi tin rằng tất cả các nhiệm vụ mã hóa đều phù hợp tự nhiên với việc học tăng cường quy mô lớn theo hướng thực thi. Do đó, chúng tôi đã mở rộng huấn luyện RL mã trên một loạt các nhiệm vụ mã hóa trong thế giới thực rộng lớn hơn. Bằng cách tự động mở rộng các trường hợp thử nghiệm của các nhiệm vụ mã hóa đa dạng, chúng tôi đã tạo ra các phiên bản huấn luyện chất lượng cao và mở khóa thành công tiềm năng toàn diện của học tăng cường. Điều này không chỉ cải thiện đáng kể tỷ lệ thành công khi thực thi mã mà còn mang lại lợi ích cho các nhiệm vụ khác. Điều này khuyến khích chúng tôi tiếp tục khám phá các nhiệm vụ khó giải quyết, dễ xác minh, như một mảnh đất màu mỡ cho việc học tăng cường quy mô lớn.
Trong các nhiệm vụ kỹ thuật phần mềm trong thế giới thực, chẳng hạn như SWE-Bench, Qwen3-Coder phải tương tác nhiều vòng với môi trường, liên quan đến lập kế hoạch, sử dụng công cụ, nhận phản hồi và đưa ra quyết định. Trong giai đoạn hậu huấn luyện của Qwen3-Coder, chúng tôi đã giới thiệu RL tầm nhìn dài (Agent RL) để khuyến khích mô hình sử dụng các công cụ để giải quyết các nhiệm vụ trong thế giới thực thông qua tương tác nhiều vòng. Thách thức chính của Agent RL là mở rộng môi trường. Để giải quyết vấn đề này, chúng tôi đã xây dựng một hệ thống có thể mở rộng, có khả năng chạy song song 20.000 môi trường độc lập, tận dụng cơ sở hạ tầng của Alibaba Cloud. Cơ sở hạ tầng cung cấp phản hồi cần thiết cho việc học tăng cường quy mô lớn và hỗ trợ đánh giá quy mô lớn. Kết quả là, Qwen3-Coder đã đạt được thành tích cao nhất trong số các mô hình mã nguồn mở trên SWE-Bench Verified, không cần mở rộng thời gian thử nghiệm.
Qwen Code là một công cụ CLI cho mục đích nghiên cứu, được điều chỉnh từ Gemini CLI, để tăng cường hỗ trợ trình phân tích cú pháp và công cụ cho các mô hình Qwen-Coder. Đảm bảo bạn đã cài đặt nodejs 20+, bạn có thể cài đặt Qwen Code bằng lệnh sau: trước tiên cài đặt nodejs thông qua curl -qL https://www.npmjs.com/install.sh | sh, sau đó sử dụng npm i -g @qwen-code/qwen-code để cài đặt Qwen Code. Qwen Code hỗ trợ OpenAI SDK khi gọi LLMs, bạn có thể xuất các biến môi trường sau hoặc đặt chúng trong tệp .env. Bây giờ, bạn có thể tận hưởng trải nghiệm mã hóa do Qwen-Code và Qwen mang lại bằng cách chỉ cần nhập qwen.
Ngoài Qwen Code, giờ đây bạn cũng có thể sử dụng Qwen3-Coder để mã hóa cùng với Claude Code. Chỉ cần yêu cầu khóa API trên nền tảng Alibaba Cloud Model Studio và cài đặt Claude Code để bắt đầu mã hóa. Chúng tôi cũng cung cấp hai điểm vào để trải nghiệm liền mạch mã hóa Qwen3-Coder. Điểm đầu tiên là Claude Code agent API, điểm thứ hai là gói npm claude-code-config để định tuyến tùy chỉnh.
Chúng ta cũng có thể định cấu hình Qwen3-Coder-480B-A35B-Instruct thông qua Cline. Trong cài đặt cấu hình Cline, hãy chọn “OpenAI Compatible” làm nhà cung cấp API, nhập khóa nhận được từ Dashscope và sử dụng URL cơ sở tùy chỉnh: https://dashscope-intl.aliyuncs.com/compatible-mode/v1, nhập qwen3-coder-plus.
Chúng tôi cũng cung cấp một số trường hợp sử dụng mẫu sử dụng Qwen3-Coder, bao gồm mô phỏng phá dỡ ống khói dựa trên vật lý, Qwen với Cline, phát triển web trò chuyện Qwen, kiểm tra WPM của bạn với các câu nói nổi tiếng, bóng nảy trong siêu khối lập phương xoay, mô phỏng hệ mặt trời và trò chơi DUET.
Cuối cùng, bạn có thể truy cập trực tiếp API của Qwen3-Coder thông qua Alibaba Cloud Model Studio. Dưới đây là cách sử dụng Qwen API với mô hình này. Bạn có thể tạo một máy khách, gửi yêu cầu đến mô hình qwen3-coder-plus và in phản hồi.
Chúng tôi vẫn đang nỗ lực tích cực để cải thiện hiệu suất của tác nhân mã hóa của mình, với mục tiêu để nó đảm nhận nhiều nhiệm vụ kỹ thuật phần mềm phức tạp và tẻ nhạt hơn, từ đó giải phóng năng suất của con người. Nhiều kích thước mô hình Qwen3-Coder hơn sắp ra mắt, mang lại hiệu suất mạnh mẽ đồng thời giảm chi phí triển khai. Ngoài ra, chúng tôi cũng đang tích cực khám phá xem tác nhân mã hóa có thể tự cải thiện hay không – đây là một hướng đi thú vị và đầy cảm hứng.
HN | Độ nóng: 724 điểm | 329 bình luận | Tác giả: danielhanchen #
https://news.ycombinator.com/item?id=44653072
- Mô hình lượng tử hóa 2bit có thể có vấn đề, mô hình lượng tử hóa từ 4bit trở lên hoạt động tốt hơn
- Mô hình lượng tử hóa động Unsloth không thực sự là 2bit, mà là hỗn hợp 2-8bit
- Các lớp quan trọng sử dụng 8bit và 6bit, các lớp thứ yếu sử dụng 2bit
- Mô hình lượng tử hóa động cần được thực hiện sau khi sửa các lỗi quan trọng của mô hình
- Việc tạo mô hình lượng tử hóa động cần xem xét lỗi lượng tử hóa kích hoạt và trọng số
- Quá trình tạo mô hình lượng tử hóa động bao gồm tính toán imatrix, quyết định số bit lượng tử hóa và tải lên, v.v., mất khoảng 8 giờ
- Sử dụng instance đám mây để lượng tử hóa, thay vì một máy đơn lẻ
- Mô hình lượng tử hóa có thể chạy hiệu quả trên một GPU 3090 duy nhất, nhưng cần có hướng dẫn chi tiết
- Hỗ trợ đa GPU phụ thuộc vào loại và tốc độ RAM, DDR5 RAM tốt hơn
- Tốc độ chạy mô hình bị giới hạn bởi băng thông RAM, CPU kép và 12 thanh DDR5 RAM có thể cải thiện hiệu suất
- Tốc độ chạy mô hình trên một GPU 3090 duy nhất có thể chỉ là 10 tokens/s, việc thêm GPU 3090 thứ hai không cải thiện nhiều
HN | Độ nóng: 586 điểm | 135 bình luận | Tác giả: fantunes #
https://news.ycombinator.com/item?id=44651066
- Sau khi Ozzy Osbourne qua đời, một số người nhớ lại câu trả lời hài hước của ông về sự kiện 11/9 trên chương trình phát thanh của Howard Stern
- Một số người đề cập đến sự hoảng loạn của phe đa số đạo đức đối với Black Sabbath trong những năm 70, 80 và ảnh hưởng của nó đối với Ozzy
- BBC đưa tin về tuyên bố của Bộ trưởng Tư pháp Anh về sự ra đi của Ozzy, một số người cảm thấy đây là “tin tức bạn không thể bịa ra”
- Một số người thảo luận về bài hát “After Forever” của Ozzy và ý nghĩa tôn giáo của nó
- Một số người chia sẻ trải nghiệm xem Black Sabbath tại Ozzfest và màn trình diễn trên sân khấu của Ozzy
- Một số người đề cập đến lối sống của Ozzy vào cuối những năm 80 và đầu những năm 90, và lý do ông có thể sống lâu
- Một số người chia sẻ video con gái Ozzy nói về buổi biểu diễn cuối cùng của ông là “đám tang” của ông, và vấn đề về độ chính xác của video do AI tạo ra
- Một số người đề cập đến việc Ozzy thất bại trong việc làm bữa sáng trong “The Decline of Western Civilization II”, đánh dấu sự khởi đầu của việc ông trở thành một ngôi sao truyền hình
- Một số người chia sẻ video tri ân các bài hát của Ozzy do Jack Black hát
- Một số người đề cập đến vai khách mời của Ozzy trong bộ phim “Little Nicky” khi đánh bại một con dơi khổng lồ
- Một số người chia sẻ bài hát Black Sabbath yêu thích của họ và thảo luận về ảnh hưởng của Ronnie James Dio đối với ban nhạc
- Một số người trích dẫn bài hát “Mama, I’m Coming Home” của Ozzy để bày tỏ sự kính trọng đối với huyền thoại
- Một số người đề cập đến việc Ozzy qua đời vì bệnh Parkinson có phần trớ trêu, vì ông đã trải qua rất nhiều chuyện
- Một số người thảo luận về mối quan hệ giữa tuổi thọ dự kiến của Ozzy và lối sống của ông
- Một số người ngạc nhiên rằng thói quen uống rượu của Ozzy không ảnh hưởng đến tuổi thọ của ông sớm hơn
- Một số người hỏi về tuổi thọ trung bình của nam giới ở Anh và thảo luận về ảnh hưởng của thời gian Ozzy sống ở Mỹ đối với tuổi thọ trung bình
Bạn có thể tắt tất cả các tính năng AI trong Zed #
You can now disable all AI features in Zed
https://zed.dev/blog/disable-ai-features
Bài viết này nói về một tính năng mới của trình soạn thảo mã Zed, cho phép người dùng tắt tất cả các tính năng AI. Dưới đây là bản tóm tắt chi tiết bằng tiếng Việt của bài viết:
Tiêu đề: Giờ đây bạn có thể tắt tất cả các tính năng AI trong Zed Tác giả: Franciska Dethlefsen Ngày: 23 tháng 7 năm 2025
Mục tiêu của Zed là xây dựng trình soạn thảo mã tốt nhất trên thế giới. Để mang lại trải nghiệm chỉnh sửa tốt nhất, Zed đã ra mắt trình soạn thảo mã AI nhanh nhất thế giới và khởi động series Agentic Engineering, khám phá cách các lập trình viên có thể sử dụng AI một cách hiệu quả. Nhưng Zed cũng quan tâm đến những người không thể hoặc không muốn sử dụng các tính năng AI của Zed. Giờ đây, người dùng có thể thêm một cài đặt toàn cục vào tệp settings.json để tắt Zed AI:
{
"disable_ai": true
}
Thay đổi này được ra mắt hôm nay trong phiên bản Preview và sẽ có trong phiên bản Stable vào tuần tới. Chẳng bao lâu nữa, người dùng mới cũng có thể tắt tất cả các tính năng AI trong Zed thông qua một công tắc trong quá trình hướng dẫn.
Tại sao tắt AI? Một số nhà phát triển có những phản đối cơ bản đối với việc sử dụng AI trong quá trình mã hóa, cho dù là về dữ liệu huấn luyện, tác động môi trường hay lý do triết học về mã do máy tạo ra. Bạn có thể thích tính dễ đoán và khả năng kiểm soát của các công cụ phát triển truyền thống hơn và không muốn các đề xuất AI làm gián đoạn quy trình làm việc của bạn. Nhiều tổ chức hạn chế việc sử dụng các công cụ AI, đặc biệt khi xử lý mã độc quyền, các nhóm pháp lý có thể yêu cầu môi trường phát triển không có AI. Các công ty khác có thể đã phê duyệt các nhà cung cấp AI cụ thể và những nhà cung cấp này chưa có sẵn trong Zed hoặc trình soạn thảo nói chung.
Zed tôn trọng ý định của bạn. Nếu bạn không muốn AI xuất hiện trong quy trình làm việc của mình, nó sẽ không xuất hiện.
Các giải pháp thay thế ưu tiên quyền riêng tư Nếu bạn chỉ lo lắng về các vấn đề riêng tư dữ liệu, Zed cung cấp một số cách để giữ an toàn:
- Sử dụng khóa của riêng bạn: Dễ dàng kết nối với nhà cung cấp AI mà bạn tin tưởng bằng khóa API của riêng bạn, kiểm soát trực tiếp mối quan hệ với nhà cung cấp.
- Giữ cục bộ: Zed cũng hỗ trợ các mô hình AI cục bộ, giữ mã của bạn hoàn toàn trên máy của bạn, đảm bảo không có dữ liệu nào rời khỏi môi trường phát triển của bạn.
- Khi bạn sử dụng dịch vụ Zed AI, mã và lời nhắc của bạn sẽ bị loại bỏ sau mỗi yêu cầu, không được lưu trữ vĩnh viễn và không được sử dụng để huấn luyện.
- Zed cũng duy trì thỏa thuận không lưu giữ với Anthropic, đảm bảo mã của bạn được giữ bí mật.
Đối với những người hoài nghi Chúng tôi hiểu những lo ngại về các công cụ AI. Chúng có thể bị thổi phồng quá mức và không nhất quán, đôi khi tạo ra kết quả đáng ngờ. Bạn không cần phải thích nó, nhưng việc hiểu nó (để sử dụng nó một cách hiệu quả hoặc chọn không sử dụng) đang trở thành một phần của nghề. Đó là lý do tại sao chúng tôi khởi động series Agentic Engineering. Chúng tôi muốn tạo ra một không gian để chúng ta thảo luận và học hỏi các kỹ thuật thực tế để duy trì nghề thủ công trong khi tận dụng AI. Ngay cả khi bạn hoài nghi, những công cụ này đang nhanh chóng trở thành cách xây dựng phần mềm. Hiểu chúng giúp bạn đưa ra quyết định sáng suốt về thời điểm và cách sử dụng chúng hoặc không sử dụng chúng.
Trình soạn thảo của bạn, lựa chọn của bạn Zed được xây dựng cho các kỹ sư quan tâm đến công cụ của họ. Điều này có nghĩa là cho phép bạn kiểm soát môi trường phát triển của mình, bao gồm cả việc chọn làm việc mà không cần AI, nếu điều đó tốt nhất cho bạn. Zed cũng là mã nguồn mở theo giấy phép GPL, vì vậy nếu bạn muốn tùy chỉnh thêm, bạn hoàn toàn có khả năng làm như vậy!
Chúng tôi sẽ tiếp tục nỗ lực để Zed trở thành trình soạn thảo mã tốt nhất trên thế giới. Điều này có nghĩa là tăng cường hỗ trợ cho Windows, cải thiện trải nghiệm AI của chúng tôi và tiếp tục cải thiện trải nghiệm cho những người không sử dụng AI.
HN | Độ nóng: 471 điểm | 225 bình luận | Tác giả: meetpateltech #
https://news.ycombinator.com/item?id=44660519
- Độ trễ nhập liệu của trình soạn thảo Zed thấp, chiếm ít tài nguyên, trải nghiệm tốt hơn so với ứng dụng web
- Chức năng AI của Zed đã gây tranh cãi kể từ khi được thêm vào, nhưng với sự bổ sung của các tính năng mới, chẳng hạn như chia sẻ màn hình, hỗ trợ cộng tác Linux, giao diện Git, trình gỡ lỗi, v.v., quy trình làm việc mang tính cách mạng trước đây giờ có vẻ sơ khai
- Hệ sinh thái plugin của Zed không bằng VSCode, điều này cản trở người dùng chuyển từ VSCode sang Zed
- Một số người dùng cho rằng, nếu IDE mới có thể tương thích với các extension của VSCode, sẽ giảm đáng kể rào cản chuyển đổi IDE của người dùng
- So sánh Zed với Neovim về độ trễ nhập liệu, Zed vượt trội hơn về độ mượt mà và trơn tru
- Chế độ nhập liệu không độ trễ của JetBrains IDE khiến nó trở thành một trong những trình soạn thảo phản hồi nhanh nhất, mặc dù có thể cảm thấy hơi chậm khi sử dụng nhiều chức năng trong các codebase lớn
- Người dùng chuyển từ VS Code sang Cursor, sau đó cảm thấy thất vọng vì Cursor phá vỡ các key binding và các vấn đề khác, cố gắng quay lại VS Code nhưng nhớ chất lượng hoàn thành tag của Cursor, sau đó thử Zed nhưng cuối cùng quay lại Cursor vì chất lượng hoàn thành tag
- Người dùng cho rằng chất lượng của mô hình hoàn thành tag là rất quan trọng, mô hình của Copilot đã được cải thiện, nhưng vẫn còn chỗ để cải thiện
- Có ý kiến cho rằng, các công ty AI lớn nên hợp tác với Zed để có được chỗ đứng trong lĩnh vực IDE
- Tốc độ hoàn thành tag của Copilot chậm, đôi khi không kích hoạt được, người dùng cần di chuyển con trỏ hoặc nhập lại code để khiến nó hoạt động
Không An Toàn và Khó Đoán: Trải Nghiệm Volvo EX90 Của Tôi #
Unsafe and Unpredictable: My Volvo EX90 Experience
Tác giả bày tỏ sự thất vọng về chiếc Volvo EX90, gọi nó là “chiếc SUV điện không đáng tin cậy nhất” và đề cập đến các vấn đề của Volvo EX90 trong “Consumer Reports”.
Tác giả kể chi tiết về trải nghiệm của mình với chiếc Volvo EX90 (Số nhận dạng xe: 7JDE23VL6SG006665), bao gồm cả việc liên lạc với Volvo Canada và Volvo Montreal Royal.
Tác giả đã thuê văn phòng luật sư Choueke Hollander, tìm cách được hoàn lại toàn bộ tiền từ Volvo. Tình trạng hiện tại của xe khiến nó không an toàn khi lái và việc đưa ra thị trường mà không được kiểm tra đầy đủ thể hiện một thất bại nghiêm trọng về kiểm soát chất lượng và an toàn cho người tiêu dùng.
- Đại lý: Volvo Montreal Royal, tác giả đã mua chiếc EX90 của mình tại Volvo Montreal Royal ở Montreal.
- Quyền sở hữu doanh nghiệp: Groupe Taddeo Auto, Volvo Montreal Royal và Volvo Laval thuộc sở hữu của cùng một công ty.
- Ban lãnh đạo Volvo Canada: Tác giả đã ba lần viết thư cho Matt Girgis, Giám đốc điều hành của Volvo Canada, nhưng không nhận được bất kỳ phản hồi nào.
Volvo Bắc Mỹ đã chính thức từ chối thay thế hoặc mua lại chiếc EX90 bị lỗi của tác giả vào ngày 17 tháng 6 năm 2025. Phản hồi của Volvo cho thấy thái độ vô trách nhiệm của họ đối với chất lượng sản phẩm và sự an toàn của người tiêu dùng.
Volvo Bắc Mỹ từ chối thay thế hoặc mua lại chiếc xe bị lỗi, ngay cả khi có các vấn đề an toàn được ghi lại và các lỗi lặp đi lặp lại.
Sau khi nộp đơn chính thức lên Volvo Canada vào ngày 1 tháng 5 năm 2025, tác giả đã nhận được một phản hồi chung chung và hời hợt sau 23 ngày chờ đợi, cho thấy sự vô trách nhiệm hoàn toàn của Volvo Canada đối với sự an toàn và hài lòng của khách hàng.
Bài viết cung cấp ảnh chụp màn hình ghi lại các lỗi thực tế của Volvo EX90, bao gồm lỗi giao tiếp hệ thống quan trọng, lỗi chìa khóa kỹ thuật số, lỗi khóa cửa, lỗi màn hình trung tâm, lỗi điều khiển khí hậu và lỗi kiểm soát ổn định điện tử.
Volvo EX90 Ultra 7 chỗ, mua vào tháng 3 năm 2025, với giá 147.605,87 đô la Canada, hiện có số dặm là 1.177 km.
Tác giả đã đặt mua một chiếc Volvo EX90 Ultra 7 chỗ thông qua trang web chính thức của Volvo vào ngày 1 tháng 2 năm 2024 và đã trả khoản đặt cọc 2.000 đô la Canada. Do cấu hình sai và chậm trễ giao hàng, tác giả đã đồng ý chấp nhận cấu hình EX90 thay thế đã trên đường vận chuyển, nhưng chiếc xe mới lại phải đối mặt với sự chậm trễ giao hàng.
HN | Độ nóng: 397 điểm | 398 bình luận | Tác giả: prova_modena #
https://news.ycombinator.com/item?id=44652374
- Volvo có thể không muốn thay xe cho chủ sở hữu, nhưng từ góc độ marketing, họ đã chọn sai vị trí.
- Trang web được làm tốt và nội dung chi tiết, khiến người ta không muốn mua chiếc xe này hoặc bất kỳ xe nào mang thương hiệu Volvo.
- Mặc dù tác giả có thể phóng đại tình hình, nhưng Volvo chắc chắn đã phạm sai lầm nghiêm trọng trong việc xử lý trường hợp này.
- Giao tiếp và quyết định của Volvo có thể có vấn đề ở cấp công ty, nhưng điều này không đại diện cho chính sách hỗ trợ khách hàng tổng thể của công ty.
- Volvo có rất nhiều câu hỏi cần trả lời, nhưng những mô tả mang tính kích động mà tác giả lựa chọn có thể không phải là lựa chọn tốt nhất.
- Là người làm việc trong lĩnh vực này, cách tác giả mô tả vấn đề của xe là chấp nhận được.
- Việc khách hàng đột ngột mất điện trên đường cao tốc là một vấn đề nghiêm trọng và không nên bị xem nhẹ.
- Tác giả đã tạo trang web vì xúc động, vì vậy nên khoan dung một chút về tính công bằng của báo cáo.
- Doanh nghiệp không xứng đáng được hưởng lợi ích của sự nghi ngờ, nếu hệ thống hỗ trợ của họ sụp đổ đến mức này, việc công khai chỉ trích và thúc đẩy họ cải thiện hỗ trợ là hợp lý.
- Nhiều ô tô hiện đại tích hợp các hệ thống điều khiển khí hậu, hệ thống thông tin giải trí và các điều khiển quan trọng khác trên màn hình, điều này có thể nghiêm trọng hơn nhiều so với việc chỉ là một đèn kiểm tra động cơ bị lỗi.
- Đèn cảnh báo tốc độ và “động cơ” của Tesla nằm trên màn hình, có thể khởi động lại màn hình khi đang lái xe, không có “điều khiển” nào trên màn hình.
- Cuộc thảo luận là về Volvo, không phải Tesla, bài viết đặc biệt chỉ ra các vấn đề điều khiển cụ thể.
- Nội dung trang web phần lớn được tạo ra bởi AI, bao gồm cả phần “phân tích”, dài hơn cả những lá thư mà nó phân tích.
- Lỗi màn hình và đèn động cơ của Volvo có thể dẫn đến việc không vượt qua được kiểm tra quốc gia.
Những điều bạn muốn biết (và có thể còn hơn thế) về cách hoạt động của băng Game Boy #
More than you wanted to know about how Game Boy cartridges work
https://abc.decontextualize.com/more-than-you-wanted-to-know/
Bài viết này được viết bởi Allison Parrish, với chủ đề về cách thức hoạt động của băng trò chơi Game Boy và cách tạo một băng trò chơi Game Boy từ đầu. Bài viết không phải là một nghiên cứu mới, mà là nỗ lực của tác giả trong việc tập hợp các thông tin liên quan và trình bày chúng một cách dễ hiểu cho những người quan tâm đến việc tạo băng Game Boy.
Tác giả giả định rằng người đọc có hiểu biết về bộ nhớ kỹ thuật số, chẳng hạn như biết “byte” là gì và bộ xử lý định địa chỉ bộ nhớ như thế nào. Đồng thời, người đọc cần có hiểu biết về cấu trúc bên trong của máy tính, biết vi xử lý là gì và vi xử lý giao tiếp với các thành phần điện tử khác như thế nào. Ngoài ra, người đọc nên hiểu về số thập lục phân và số nhị phân, nhưng không cần có kiến thức cụ thể về điện tử học hoặc các thành phần điện tử.
Trong bài viết, số thập lục phân bắt đầu bằng 0x, số nhị phân bắt đầu bằng 0b. Nếu tên của chân (pin) hoặc kết nối có dấu gạch dưới ở phía trước, điều đó có nghĩa là chân đó hoạt động ở mức thấp. Trong bài viết sẽ có các đoạn được đánh dấu là “💡”, đây là những lời bình luận mang tính kỹ thuật, cung cấp một số sự thật và giải thích mà tác giả muốn đưa vào, nhưng không cần thiết để hiểu nội dung tổng thể của bài viết, người đọc có thể chọn bỏ qua.
Tác giả thảo luận về lý do tại sao Game Boy đáng được quan tâm, bao gồm hiệu năng tương đối mạnh mẽ, thiết kế đơn giản dễ học, tính di động và hiệu quả năng lượng, khả năng viết phần mềm tùy chỉnh mà không cần phải vượt qua các biện pháp bảo vệ bản quyền hoặc phần cứng khóa khu vực, tài liệu chi tiết, thư viện phần mềm khổng lồ và chuỗi công cụ mã nguồn mở được duy trì tích cực, v.v.
Bài viết tiếp tục thảo luận về các khái niệm cơ bản của băng trò chơi Game Boy. Vào cuối những năm 1980 và đầu những năm 1990, ranh giới giữa phần mềm và phần cứng khá mơ hồ, đặc biệt là đối với máy chơi trò chơi điện tử và máy tính gia đình. Game Boy có một ROM nhỏ tích hợp làm trình khởi động, nhưng nó không có “hệ điều hành” thực sự, cũng như không có bộ nhớ không khả biến có thể ghi lại được tích hợp.
HN | Độ nóng: 396 điểm | 42 bình luận | Tác giả: todsacerdoti #
https://news.ycombinator.com/item?id=44651770
- TXB0108 của TI có vấn đề, dễ thay đổi hướng truyền dưới ảnh hưởng của nhiễu điện, có thể dẫn đến điều khiển chéo đầu vào và đầu ra, gây ra các vấn đề nghiêm trọng.
- Những linh kiện này có rủi ro tiềm ẩn, không nên quảng cáo quá mức, chỉ những chuyên gia thực sự hiểu rõ về chế độ lỗi của chúng mới nên sử dụng.
- Đầu ra của linh kiện dễ tạo ra vòng lặp, dẫn đến tự động đảo ngược hướng, gây khó khăn khi sử dụng trong các ứng dụng thực tế.
- Trong thiết kế, U6 và U8 cần xử lý tách rời gần đó, logic LVC tiêu thụ nhiều năng lượng trong quá trình chuyển đổi, cần nguồn điện tốt.
- Bộ chuyển đổi mức WideBus 16-wide cần tách rời riêng cho từng chân nguồn.
- Đầu ra của U6 có thể có hướng bus sai, VBUS không phải là mức logic, không thể dùng làm tín hiệu logic và không thể điều khiển nhiều thiết bị.
- Cổng USB không có bảo vệ ESD, nên sử dụng các linh kiện bảo vệ như ECMF02-4CMX8.
- Sơ đồ mạch của Q1 không đủ rõ ràng, nên biểu diễn bằng hai MOSFET thông thường.
- Các đường 4, 5, 6, 7 của IC2 bị điều khiển chéo, không nên nối đất đồng thời.
- Chân SENSE của U7 tiêu thụ dòng điện rất nhỏ, không cần lãng phí năng lượng trong bộ chia điện trở.
- Nên thêm tụ điện phân dung lượng lớn vào mạng phân phối điện để giảm độ suy giảm.
- Tác giả hy vọng bài viết có thể giúp ích trong việc thiết kế băng tùy chỉnh, ví dụ như thêm chip OPL3-L vào băng để phát nhạc FM.
- Một số trang web tài nguyên phát triển GB cũ đã đóng cửa, nhưng vẫn còn một số dự án đầy cảm hứng.
- Mặc dù Game Boy không có khóa khu vực, nhưng vẫn cần kiểm tra nhãn hiệu khi phát triển phần mềm tùy chỉnh.
- Việc vận chuyển RAM và dung lượng đĩa cùng với ứng dụng là một ý tưởng hay, tương tự như việc điện thoại thay đổi băng mỗi vài năm để tận dụng những tiến bộ của công nghệ chip.
- Khái niệm điện thoại mô-đun đã được đề xuất từ lâu, nhưng có vẻ không khả thi do làm tăng độ trễ giữa các chip và giảm độ tin cậy.
- Điện thoại thường cần cập nhật nhiều bộ phận cùng một lúc, chẳng hạn như màn hình, camera, CPU, RAM và pin, vì vậy việc thay thế từng bộ phận riêng lẻ không bằng việc mua điện thoại mới trực tiếp.
- Việc bán chip mô-đun 2G/5G/WiFi của điện thoại dưới dạng băng có thể là một ý tưởng thú vị, tương tự như PC Card.
- Chia công nghệ thành frontend và backend, tất cả các công nghệ ẩn được đặt trong băng, màn hình và đầu vào cảm ứng là frontend, có thể duy trì tính nhất quán của giao diện người dùng.
- Nếu băng đủ tiên tiến, nó có thể trực tiếp xuất bộ đệm khung hình ra màn hình mà không cần tính toán trên bo mạch chủ gốc.
Cảnh sát nói tội phạm sử dụng Google Pixel với GrapheneOS – Tôi nói đó là tự do #
Cops say criminals use a Google Pixel with GrapheneOS – I say that’s freedom
https://www.androidauthority.com/why-i-use-grapheneos-on-pixel-3575477/
Bài viết này thảo luận về việc cảnh sát Tây Ban Nha bắt đầu lập hồ sơ những người dựa trên thương hiệu điện thoại của họ, đặc biệt là những người mang điện thoại Google Pixel, vì họ tin rằng những điện thoại này có liên quan đến hoạt động tội phạm. Cảnh sát liên kết điện thoại Pixel với tội phạm không phải vì chip bảo mật của Google, mà vì GrapheneOS, một hệ điều hành tập trung vào quyền riêng tư, có thể thay thế hệ điều hành Pixel mặc định.
Tác giả Calvin Wankhede chia sẻ kinh nghiệm sử dụng điện thoại Pixel chạy GrapheneOS của mình và cho rằng giả định này thật đáng lo ngại. Anh ấy sử dụng GrapheneOS vì nhiều lý do, nhưng tránh né cơ quan thực thi pháp luật không phải là một trong số đó. Anh ấy tin rằng nhiều người dùng Pixel sẽ được hưởng lợi từ việc chuyển từ hệ điều hành Android mặc định sang GrapheneOS và điều này không liên quan gì đến hoạt động tội phạm.
Bài viết giải thích lý do tại sao tác giả sử dụng và giới thiệu GrapheneOS. Quá trình cài đặt GrapheneOS rất đơn giản, không làm mất bất kỳ tính năng phần mềm hiện đại nào. Mặc dù GrapheneOS không bao gồm bất kỳ dịch vụ nào của Google, nhưng tác giả ngạc nhiên khi thấy có thể cài đặt Play Store tương đối dễ dàng và hầu hết các ứng dụng đều chạy hoàn hảo, bao gồm cả hầu hết các ứng dụng ngân hàng. GrapheneOS cũng có những lợi thế lớn về quyền riêng tư và bảo mật, nó khóa các phần khác nhau của Android để giảm các vectơ tấn công và thực thi cách ly sandbox nghiêm ngặt hơn, đảm bảo các ứng dụng được cách ly với nhau.
Tác giả đề cập rằng GrapheneOS đối xử với các ứng dụng của Google giống như bất kỳ phần mềm không rõ nguồn gốc nào khác, điều này có nghĩa là các ứng dụng của Google buộc phải chạy trong sandbox và quyền truy cập vào dữ liệu người dùng bị hạn chế. Khả năng cách ly sandbox của GrapheneOS cũng mở rộng sang các ứng dụng xâm nhập như Google Play Services và Play Store. Người dùng có thể tắt thủ công từng quyền của các ứng dụng này và trên thực tế, hầu hết các quyền đều bị tắt theo mặc định. Tốt hơn nữa, người dùng có thể tạo các hồ sơ người dùng khác nhau để cách ly các ứng dụng yêu cầu nhiều quyền. GrapheneOS có thể chuyển tiếp thông báo đến hồ sơ người dùng chính, điều mà Android gốc không thể làm được.
Về quyền ứng dụng, GrapheneOS cũng được tăng cường. Ví dụ: người dùng có thể chặn ứng dụng truy cập internet và đọc cảm biến của thiết bị, điều mà Android gốc không cung cấp khả năng kiểm soát chi tiết như vậy. Và, mặc dù quyền Android thường áp dụng phương pháp “tất cả hoặc không có gì”, GrapheneOS cho phép người dùng chỉ chọn chính xác các liên hệ, ảnh hoặc tệp mà họ muốn hiển thị cho ứng dụng.
Tính năng GrapheneOS yêu thích của tác giả là khả năng thiết lập mã PIN cưỡng bức. Khi nhập mã PIN phụ này, việc xóa vĩnh viễn tất cả dữ liệu trên điện thoại sẽ được kích hoạt, bao gồm cả eSIM đã cài đặt. Nếu tác giả buộc phải giao mật khẩu điện thoại, anh ấy có thể yên tâm rằng kẻ tấn công sẽ không thể truy cập dữ liệu của mình.
Bài viết kết thúc bằng việc thảo luận xem GrapheneOS có làm quá mức về quyền riêng tư và bảo mật hay không. GrapheneOS là một trong nhiều công cụ hiện đang phải đối mặt với sự nghi ngờ và áp lực chính trị vì khiến việc giám sát trở nên khó khăn hơn. Bài viết lấy ví dụ về ứng dụng Signal, một ứng dụng nhắn tin được mã hóa, trong những năm gần đây liên tục bị các nhà lập pháp EU nhắm mục tiêu. Đặc biệt, luật “kiểm soát trò chuyện” được đề xuất sẽ buộc các nền tảng nhắn tin an toàn phải quét tất cả các liên lạc, bao gồm cả những liên lạc được bảo vệ bằng mã hóa đầu cuối, để tìm nội dung bất hợp pháp, chẳng hạn như tài liệu lạm dụng tình dục trẻ em. Các nhà phát triển của Signal đã chỉ ra một cách chính xác rằng việc quét bắt buộc trên thiết bị về bản chất tương đương với cửa hậu (backdoor). Một chính phủ bất hảo có thể lạm dụng các quyền này để theo dõi những công dân bất đồng chính kiến hoặc đối thủ chính trị, trong khi tin tặc có thể đánh cắp thông tin tài chính.
Các cơ quan quản lý từ lâu đã yêu cầu các ứng dụng bảo mật phải thỏa hiệp về sứ mệnh duy nhất của chúng: quyền riêng tư. GrapheneOS gần đây đã chỉ ra một sự trớ trêu cay đắng trong một dòng tweet. Năm 2019, khu vực Catalonia của Tây Ban Nha là trung tâm của một vụ bê bối phần mềm gián điệp Pegasus quy mô lớn. Pegasus, một công cụ giám sát phức tạp được bán độc quyền cho các chính phủ, được báo cáo là đã được sử dụng để hack điện thoại thuộc về các thành viên của Nghị viện Châu Âu và nghe lén các liên lạc của họ. Tuy nhiên, giờ đây, cảnh sát ở khu vực này lại đang xem xét kỹ lưỡng những người dùng Pixel và GrapheneOS am hiểu công nghệ, những người đã tăng cường thiết bị của họ để chống lại sự giám sát bất hợp pháp và các vectơ tấn công khác. Các nhà phát triển mã nguồn mở không thể kiểm soát phần mềm của họ được sử dụng cho mục đích gì, điều này đúng với cả GrapheneOS và Signal. Chắc chắn, một số tội phạm tự nhiên sẽ muốn tận dụng các công cụ bảo mật và quyền riêng tư mà những người còn lại trong chúng ta sử dụng. Người ta có thể nói rằng hộp diêm được sử dụng để đốt phá, tiền mặt được sử dụng để rửa tiền, nhưng không ai kêu gọi các cơ quan quản lý cấm cả hai thứ này. Trên thực tế, hầu hết mọi người đều phản đối việc lập hồ sơ của cơ quan thực thi pháp luật. Vì vậy, nếu tôi sử dụng GrapheneOS trên Pixel của mình để bảo vệ dữ liệu của mình khỏi các công ty công nghệ lớn, tin tặc tiềm năng hoặc thậm chí là các chính phủ nghe lén, thì bản thân điều đó không nên khiến tôi thuộc cùng loại với những kẻ buôn bán ma túy.
HN | Độ nóng: 391 điểm | 304 bình luận | Tác giả: pabs3 #
https://news.ycombinator.com/item?id=44658908
- GrapheneOS phản đối nhà nước cảnh sát giám sát quy mô lớn, cho rằng những người theo chủ nghĩa độc đoán và giới truyền thông châu Âu đang xuyên tạc GrapheneOS và điện thoại Pixel
- Khu vực Catalonia của Tây Ban Nha là trung tâm của vụ bê bối phần mềm gián điệp Pegasus năm 2019, giờ đây cảnh sát lại đang kiểm duyệt người dùng sử dụng Pixel và GrapheneOS
- Giám sát trong nước chỉ nhắm vào người bình thường, không nhắm vào người giàu và quyền thế
- Các biện pháp bảo vệ hiến pháp ở các quốc gia dân chủ về vấn đề Epstein hạn chế cách sử dụng mạng lưới giám sát
- GrapheneOS không phải là không thể bị khai thác, nhưng nỗi sợ hãi về nó là bịa đặt, cảnh sát và bạn bè đang cố gắng thuyết phục mọi người rằng nó không thể bảo vệ quyền riêng tư và bảo mật
- So sánh GrapheneOS với tủ lạnh, cho rằng tủ lạnh tốt có thể được sử dụng cho tội phạm, nhưng không nên cấm bán vì điều đó
- Bằng cách tích hợp dữ liệu từ các quốc gia khác nhau, tạo API để kiểm soát việc mua một số sản phẩm nhất định, để ngăn chặn tội phạm
- Mũ balaclava có nhiều mục đích sử dụng hợp pháp, nhưng hiếm khi thấy mọi người đội chúng trong cuộc sống hàng ngày, mối liên hệ với tội phạm không nên dẫn đến lệnh cấm
- Ở Đan Mạch, việc đội mũ balaclava ở nơi công cộng bị cấm trừ khi có thể chứng minh mục đích sử dụng hợp pháp
- Mũ balaclava không được phát minh ra cho tội phạm, nhưng trong lịch sử có liên quan đến chiến tranh
- Binh lính Anh nhận được nhiều mũ balaclava dệt tại nhà vì không chuẩn bị đầy đủ
- Ở Thụy Điển, việc đội mũ balaclava trong các cuộc biểu tình là bất hợp pháp
- Anh có các quy định tương tự đối với dao, cho rằng những quy định này là vô lý
- Chính phủ Ireland đã xem xét việc cấm mũ balaclava, nhưng không rõ liệu có thực hiện hay không
- Southampton, Anh đã thử cấm mũ balaclava nhưng không thành công
- Có thể cung cấp dịch vụ kiểm soát rò rỉ chất làm lạnh để giảm hiệu quả của tủ lạnh trong việc làm lạnh xác chết
Cerebras ra mắt Qwen3-235B, đạt được 1.5k tokens mỗi giây #
Cerebras launches Qwen3-235B, achieving 1.5k tokens per second
Ngày 8 tháng 7 năm 2025, Cerebras Systems đã công bố ra mắt Qwen3-235B, một mô hình suy luận AI tiên tiến nhanh nhất thế giới với hỗ trợ ngữ cảnh đầy đủ 131K, hiện đã có sẵn trên nền tảng Cerebras Inference Cloud. Cột mốc này đánh dấu một bước đột phá lớn trong hiệu suất của mô hình AI, kết hợp trí thông minh cấp độ tiên tiến với tốc độ chưa từng có, với chi phí chỉ bằng một phần mười so với các mô hình nguồn đóng, từ đó thay đổi căn bản việc triển khai AI của doanh nghiệp.
Trí thông minh của mô hình Qwen3-235B được cung cấp trên Cerebras có thể so sánh với các mô hình tiên tiến như Claude 4 Sonnet, Gemini 2.5 Flash và DeepSeek R1, những mô hình này vượt trội hơn các mô hình khác trong các bài kiểm tra chuẩn về khoa học, mã hóa và kiến thức chung. Qwen3-235B sử dụng kiến trúc hỗn hợp chuyên gia hiệu quả, mang lại hiệu quả tính toán vượt trội, cho phép Cerebras cung cấp mô hình này với giá 0,60 đô la cho mỗi triệu token đầu vào và 1,20 đô la cho mỗi triệu token đầu ra, chi phí này chưa bằng một phần mười so với các mô hình nguồn đóng tương tự.
Cerebras sử dụng Wafer Scale Engine để tăng tốc Qwen3-235B lên 1.500 token mỗi giây, giảm thời gian phản hồi từ 1-2 phút xuống còn 0,6 giây, giúp cho các quy trình làm việc về mã hóa, suy luận và RAG sâu gần như tức thời. Theo đo lường của Artificial Analysis, Cerebras là công ty duy nhất trên thế giới cung cấp mô hình AI tiên tiến có khả năng tạo ra đầu ra với tốc độ hơn 1.000 token mỗi giây, thiết lập một tiêu chuẩn mới cho hiệu suất AI thời gian thực.
Với lần ra mắt này, Cerebras đã mở rộng hỗ trợ độ dài ngữ cảnh của mình từ 32K lên 131K token, đây là giá trị lớn nhất mà Qwen3-235B hỗ trợ. Việc mở rộng này ảnh hưởng trực tiếp đến khả năng suy luận các cơ sở mã lớn và các tài liệu phức tạp của mô hình. Mặc dù ngữ cảnh 32K là đủ để đáp ứng các trường hợp sử dụng tạo mã đơn giản, nhưng ngữ cảnh 131K cho phép mô hình xử lý đồng thời hàng chục tệp và hàng chục nghìn dòng mã, từ đó cho phép phát triển ứng dụng cấp độ sản xuất. Độ dài ngữ cảnh được tăng cường này có nghĩa là Cerebras hiện đang nhắm trực tiếp vào thị trường tạo mã doanh nghiệp, một trong những phân khúc lớn nhất và phát triển nhanh nhất của AI tạo sinh.
Để thể hiện những khả năng mới này, Cerebras đã thiết lập quan hệ đối tác chiến lược với Cline, một tác nhân mã hóa hàng đầu cho Microsoft VS Code với hơn 1,8 triệu lượt cài đặt. Người dùng Cline hiện có thể truy cập trực tiếp vào mô hình Cerebras Qwen trong trình chỉnh sửa, bắt đầu với Qwen3-32B với ngữ cảnh 64K từ lớp miễn phí. Chương trình khuyến mãi này sẽ mở rộng để bao gồm Qwen3-235B với ngữ cảnh 131K, với tốc độ tạo mã nhanh hơn 10-20 lần so với các lựa chọn thay thế như DeepSeek R1.
Cerebras Systems là một đội ngũ bao gồm các kiến trúc sư máy tính tiên phong, các nhà khoa học máy tính, các nhà nghiên cứu học sâu và các kỹ sư thuộc nhiều loại khác nhau. Chúng tôi tập hợp lại để xây dựng một danh mục siêu máy tính AI mới từ đầu để tăng tốc AI tạo sinh. Sản phẩm chủ lực của chúng tôi, hệ thống CS-3, được cung cấp bởi bộ xử lý AI thương mại có sẵn lớn nhất và nhanh nhất thế giới, Wafer-Scale Engine-3. CS-3 có thể nhanh chóng và dễ dàng tích hợp thành siêu máy tính AI lớn nhất thế giới và giúp việc đặt các mô hình trên siêu máy tính trở nên cực kỳ đơn giản, tránh được sự phức tạp của tính toán phân tán. Cerebras Inference cung cấp tốc độ suy luận đột phá, cho phép khách hàng tạo ra các ứng dụng AI tiên tiến. Các công ty, tổ chức nghiên cứu và chính phủ hàng đầu sử dụng các giải pháp Cerebras để phát triển các mô hình độc quyền đột phá và đào tạo các mô hình nguồn mở với hàng triệu lượt tải xuống. Các giải pháp Cerebras có sẵn thông qua Cerebras Cloud và tại chỗ. Để biết thêm thông tin, vui lòng truy cập cerebras.ai hoặc theo dõi chúng tôi trên LinkedIn, X và/hoặc Threads.
HN | Độ nóng: 344 điểm | 144 bình luận | Tác giả: mihau #
https://news.ycombinator.com/item?id=44657727
- Mô hình Qwen3-235B do Cerebras phát hành có thể là tin cũ, khác với thông số kỹ thuật của mô hình Qwen 3 coder 405B được phát hành gần đây.
- Qwen3-235B A22B trên OpenRouter là một phiên bản của DeepInfra, Parasail, Together, Nebiu AI Studio, Friendli, Fireworks, Cerebras.
- Để sử dụng Qwen3-235B cần 2TB bộ nhớ, 45 chip Cerebras ghép nối, tổng chi phí khoảng 135 triệu đô la Mỹ, so với đó, hệ thống DGX B200 kinh tế hơn.
- Kiến trúc của Cerebras cho phép bộ nhớ và tính toán mở rộng riêng biệt, có thể sử dụng MemoryX làm HBM, kết nối tốc độ cao với SRAM của chip.
- Cerebras đạt được tốc độ cao bằng cách sử dụng SRAM, tương tự như chip của Graphcore, có thể khó sử dụng DRAM.
- Ưu điểm của Cerebras là có 44GB SRAM, có thể giảm độ trễ giao tiếp với HBM, nâng cao hiệu suất.
- Đối với mô hình 235B fp16, mỗi lần thực thi đồ thị cần truyền 470GiB dữ liệu, cần băng thông bus rất cao để tránh độ trễ I/O.
- Cerebras có thể không sử dụng biểu diễn dày đặc, nhu cầu bộ nhớ thực tế có thể thấp hơn dự kiến, có thể là sự kết hợp giữa SRAM và DRAM.
- MemoryX có độ trễ thấp hơn so với H100 HBM3, nhưng băng thông thấp hơn nhiều so với H100 HBM3.
Cảnh báo Động đất Android: Một hệ thống toàn cầu để cảnh báo sớm #
Android Earthquake Alerts: A global system for early warning
https://research.google/blog/android-earthquake-alerts-a-global-system-for-early-warning/
Bài viết này giới thiệu một hệ thống cảnh báo sớm động đất toàn cầu - Android Earthquake Alerts. Hệ thống này sử dụng mạng lưới điện thoại thông minh Android trên toàn cầu để phát hiện động đất và cung cấp cảnh báo sớm cho người dùng, từ đó xây dựng lòng tin của người dùng. Dưới đây là bản tóm tắt chi tiết bằng tiếng Việt của bài viết:
Bài viết bắt đầu bằng việc đề cập đến động đất là một mối đe dọa mà cộng đồng toàn cầu liên tục phải đối mặt. Mặc dù chúng ta đã có thể dự đoán địa điểm có khả năng xảy ra động đất, nhưng khi động đất xảy ra, hậu quả tàn phá của nó vẫn rất nghiêm trọng. Bài viết đặt ra một câu hỏi: Điều gì sẽ xảy ra nếu chúng ta có thể đưa ra cảnh báo trước vài giây trước khi động đất xảy ra? Vài giây này đủ để mọi người xuống khỏi thang, tránh xa các vật nguy hiểm và tìm chỗ trú ẩn. Trong nhiều năm, mục tiêu của hệ thống cảnh báo sớm động đất (EEW) là cung cấp những cảnh báo như vậy.
Bài viết tiếp tục giới thiệu nghiên cứu “Phát hiện và cảnh báo động đất toàn cầu bằng điện thoại Android”, được công bố trên tạp chí Science. Nghiên cứu này trình bày cách chuyển đổi mạng lưới điện thoại thông minh Android toàn cầu thành một hệ thống phát hiện động đất mạnh mẽ, kích thước bỏ túi, để giúp bổ sung cho các hệ thống cảnh báo chính thức. Trong bốn năm qua, hệ thống Android Earthquake Alerts đã phát hiện hàng nghìn trận động đất và gửi cảnh báo đến hàng triệu người ở gần 100 quốc gia, thường cho họ thời gian quý báu để tìm chỗ trú ẩn trước khi rung chấn động đất ập đến. Thông qua việc đánh giá hàng nghìn trận động đất, phân tích các trường hợp động đất cụ thể và phản hồi trực tiếp từ người dùng, hệ thống có thể liên tục cải thiện hiệu suất của mình trong các lĩnh vực quan trọng (như ước tính độ lớn), giúp cảnh báo trở nên hiệu quả hơn theo thời gian.
Bài viết giải thích nguyên lý hoạt động của hệ thống: Gia tốc kế trong điện thoại Android, tức là cảm biến xoay màn hình khi điện thoại được xoay ngang, cũng có thể phát hiện rung động mặt đất do động đất gây ra. Nếu một điện thoại đang đứng yên phát hiện ra sóng P ban đầu, di chuyển nhanh của động đất, nó sẽ gửi tín hiệu đến máy chủ phát hiện động đất của chúng tôi, cùng với vị trí gần đúng nơi rung chuyển xảy ra. Sau đó, hệ thống sẽ nhanh chóng phân tích dữ liệu từ nhiều điện thoại để xác nhận xem có động đất xảy ra hay không và ước tính vị trí và độ lớn của nó. Mục tiêu là cảnh báo càng nhiều người càng tốt trước khi sóng S chậm hơn, có sức tàn phá lớn hơn của trận động đất ập đến. Hệ thống sẽ phát ra hai loại cảnh báo: Cảnh báo BeAware (dự kiến rung lắc nhẹ) và cảnh báo TakeAction (dự kiến rung lắc mạnh, sẽ tiếp quản màn hình điện thoại và phát ra âm thanh lớn). Để nhận cảnh báo, người dùng phải có kết nối Wi-Fi và/hoặc dữ liệu di động, đồng thời bật Android Earthquake Alerts và cài đặt vị trí. Cảnh báo được gửi dựa trên vị trí thô, bảo vệ quyền riêng tư của thiết bị. Người dùng không muốn nhận các cảnh báo này có thể tắt cảnh báo động đất trong cài đặt thiết bị.
Bài viết đề cập rằng vào tháng 4 năm 2021, họ bắt đầu triển khai các cảnh báo do Android phát hiện, bắt đầu từ New Zealand và Hy Lạp. Đến cuối năm 2023, hệ thống đã hoạt động ở 98 quốc gia. Hệ thống đã phát hiện hơn 18.000 trận động đất, từ những trận động đất nhỏ M1.9 đến những trận động đất lớn M7.8. Đối với các sự kiện đủ quan trọng để cảnh báo mọi người, hệ thống đã đưa ra cảnh báo cho hơn 2000 trận động đất, với tổng cộng 790 triệu cảnh báo được gửi đến điện thoại trên toàn cầu. Tác động của nó là số lượng người có quyền truy cập vào hệ thống EEW đã tăng lên khoảng 10 lần. Năm 2019, chỉ có khoảng 250 triệu người có quyền truy cập. Ngày nay, nhờ hệ thống Android, con số này đã tăng lên 2,5 tỷ.
Bài viết kết luận bằng cách thảo luận về một trong những phần khó khăn nhất của hệ thống EEW: ước tính độ lớn của trận động đất trong thời gian thực. Độ lớn cho chúng ta biết quy mô của trận động đất, từ đó quyết định rung chấn sẽ lan truyền bao xa và cần cảnh báo ai. Ước tính chính xác điều này là rất quan trọng - đánh giá thấp có thể không cảnh báo những người đang gặp nguy hiểm; đánh giá quá cao có thể đưa ra cảnh báo sai, làm xói mòn lòng tin của công chúng. Thách thức là tìm sự cân bằng giữa phản ứng nhanh và độ chính xác.
HN | Độ nóng: 324 điểm | 118 bình luận | Tác giả: michaefe #
https://news.ycombinator.com/item?id=44651092
- Một báo động khẩn cấp trên toàn quốc ở Israel đã khiến tất cả điện thoại di động rung đồng thời, bị phát hiện nhầm là động đất.
- Hệ thống cảnh báo động đất nên kích hoạt trước khi động đất xảy ra, trong khi cảnh báo ở Israel chỉ được đưa ra sau 30 giây sau khi phát hiện rung chấn.
- Hiệu quả của hệ thống cảnh báo động đất phụ thuộc vào tốc độ internet nhanh hơn sóng địa chấn, và chỉ có hiệu quả đối với những người ở xa tâm chấn.
- Nhận được cảnh báo động đất của Google sau 30 giây đến năm phút sau khi động đất xảy ra, dấu hiệu động đất tốt nhất là tiếng kêu cót két của cửa sổ gỗ cũ năm giây trước khi động đất.
- Hệ thống cảnh báo động đất phát hiện các rung động nhỏ (sóng P) nhanh hơn, hy vọng mọi người có thể kịp thời thoát thân trước khi trận động đất lớn ập đến.
- Rung động của điện thoại di động bị phát hiện nhầm là động đất, dẫn đến báo động sai.
- Hệ thống cảnh báo nên gửi thông báo ngay sau khi phát hiện, thay vì sau khi động đất xảy ra.
- Hệ thống cảnh báo không tính đến rung động của chính điện thoại, đây là một lỗi triển khai.
- Nhiều quốc gia thường xuyên sử dụng các tin nhắn cảnh báo khẩn cấp diện rộng.
- Điện thoại di động và máy tính bảng đọc sách đặt cạnh nhau có thể vô tình kích hoạt cảnh báo.
- Đã sửa lỗi báo động sai, sau đó có rất nhiều chương trình phát sóng di động khẩn cấp.
- Hệ thống cảnh báo nên thêm một kiểm tra để đảm bảo phần cứng không can thiệp vào số đọc của các cảm biến khác.
- Hệ thống cảnh báo dường như không phải lúc nào cũng chính xác và đôi khi tạo ra báo động sai.
- Khi động đất xảy ra, lưu lượng truy cập toàn cầu sẽ tăng đột biến do mọi người kiểm tra thông tin về động đất.
- Hệ thống cảnh báo nên xử lý tín hiệu cho tất cả các tín hiệu IMU để xem chúng có liên quan hay không và phù hợp với khoảng cách đến tâm chấn động đất.
- Hệ thống cảnh báo có thể bị kích hoạt bởi sự rung lắc thống nhất của điện thoại di động trong các sự kiện lớn (chẳng hạn như buổi hòa nhạc của Taylor Swift).
- Hệ thống cảnh báo cần phát hiện rung động từ một khu vực lớn hơn để kích hoạt cảnh báo.
- Tần số rung động của động đất cao hơn tần số mọi người lắc lư từ bên này sang bên kia.
- Hệ thống cảnh báo gây ra báo động sai, điều này thật trớ trêu.
- Cảnh báo có thể là do vụ nổ của chính họ gây ra.
- Đây là một dự án thú vị, mang lại cảm giác như phong cách Google thời xưa, làm vì có khả năng.
- Đây là một hệ thống thực sự hữu ích, không có quảng cáo, không có góc độ kiếm tiền đáng sợ, cảm giác hiếm thấy trong thời đại ngày nay.
- Những tính năng “tuyệt vời” này có thể chỉ là để người dùng bật dịch vụ vị trí để họ có thể bị theo dõi vĩnh viễn.
Swift-erlang-actor-system #
Swift-erlang-actor-system
https://forums.swift.org/t/introducing-swift-erlang-actor-system/81248
Bài viết này giới thiệu một hệ thống actor phân tán Swift mới: swift-erlang-actor-system. Hệ thống này cho phép các chương trình Swift tham gia vào các cụm Erlang phân tán. Bài viết cung cấp một ví dụ chương trình trò chuyện đơn giản, sử dụng hệ thống actor này.
Erlang (cũng như các ngôn ngữ khác chạy trên máy ảo của nó) có thể kết nối nhiều hệ thống thời gian chạy với nhau thông qua Erlang phân tán, mỗi thời gian chạy được gọi là một “node”. Erlang cũng hỗ trợ “C node”, cho phép các chương trình ngoài hệ thống thời gian chạy Erlang giao tiếp với các Erlang node và C node khác. Tác giả đã đóng gói chức năng C node này thành một hệ thống actor, có thể được sử dụng với các actor phân tán của Swift.
Bài viết cung cấp các bước để thử sử dụng hệ thống này:
- Cài đặt Elixir và khởi động “Erlang Port Mapper Daemon” (epmd), đây là cách các Erlang node khám phá lẫn nhau thông qua tên thay vì IP và cổng.
- Khởi động một Elixir node tương tác và lấy cookie và hostname.
- Tạo một Swift package phụ thuộc vào otp-interop/swift-erlang-actor-system và thiết lập node và actor phân tán.
- Chạy tệp thực thi Swift và gửi tin nhắn từ Elixir đến Swift node.
Các actor của Swift ánh xạ tốt với các tiến trình Erlang, và sự hỗ trợ cấp ngôn ngữ của Swift cho các actor phân tán giúp giao diện giữa hai ngôn ngữ trở nên dễ dàng.
Về động cơ, tác giả đề cập rằng trong tổ chức otp-interop GitHub, còn có một package có tên là elixir_pack, được sử dụng để đóng gói các ứng dụng Elixir để chạy trên iOS và các nền tảng Apple khác. Họ cần một cách rõ ràng để giao tiếp giữa Swift và Elixir trên thiết bị và các actor phân tán của Swift là lựa chọn hoàn hảo. Họ cũng bắt đầu khám phá việc sử dụng Erlang phân tán cho tương tác client-server, bằng cách lọc tin nhắn trên server trước khi chấp nhận chúng.
Về thiết kế chi tiết, swift-erlang-actor-system sử dụng thư viện C erl_interface của Erlang/OTP cho mạng và tuần tự hóa. Nó được bao gồm như một mục tiêu nguồn C trong Swift package. Người dùng có thể thay thế Transport để hỗ trợ các trường hợp sử dụng tùy chỉnh, chẳng hạn như sử dụng WebSockets thay vì socket TCP thô.
Về tuần tự hóa tin nhắn, Erlang phân tán sử dụng định dạng external term để tuần tự hóa bất kỳ giá trị nào trong máy ảo Erlang. erl_interface cung cấp các hàm để mã hóa/giải mã term. Tác giả đã chuyển đổi bất kỳ kiểu Codable nào sang định dạng này thông qua các lớp TermEncoder và TermDecoder.
Tác giả cũng đề cập đến một thách thức khi xây dựng hệ thống actor này, đó là làm thế nào để xác định các lệnh gọi từ xa giữa các ngôn ngữ khác nhau. Swift mặc định sử dụng tên hàm bị “mangled” để xác định các lệnh gọi từ xa. Để gọi một hàm trên một Swift node từ một Erlang node, Erlang node cần biết tên mangling của Swift. Để giải quyết vấn đề này, họ đã thêm macro @StableNames. Điều này cho phép bạn trang trí các phương thức actor của mình bằng một tên duy nhất tùy chỉnh.
Cuối cùng, tác giả bày tỏ mong muốn được nghe thêm nhiều ý tưởng về hệ thống actor này cũng như các actor phân tán trong Swift.
HN | Độ nóng: 308 điểm | 66 bình luận | Tác giả: todsacerdoti #
https://news.ycombinator.com/item?id=44651539
- Dự án này nhằm mục đích xây dựng một trình duyệt web có thể hiển thị UI gốc, sử dụng SwiftUI thay thế cho HTML.
- Thông qua Virtual DOM và tiến trình Erlang, thực hiện giao tiếp trực tiếp giữa tài liệu và các view SwiftUI.
- Dự án thử nghiệm biên dịch các thư viện JS phía client thành WASM, chạy trong trình duyệt headless và giao tiếp với backend Elixir.
- Mục tiêu là mang trải nghiệm phát triển Web đến tất cả các nền tảng gốc có framework UI có thể kết hợp.
- Hiện tại hỗ trợ hầu hết tất cả các nền tảng mục tiêu SwiftUI, ngoại trừ Apple Watch, vì nó thiếu các chức năng mạng thiết bị cần thiết.
- Có người đặt câu hỏi về lợi ích của việc áp dụng mô hình phát triển Web vào phát triển gốc, cho rằng phát triển Web phức tạp và gây khó hiểu.
- Có người so sánh dự án này với React Native/Expo, cho rằng đây là một cách triển khai hợp lý hơn.
- Có người đặt câu hỏi về chức năng mạng của Apple Watch và các hạn chế đối với các ứng dụng của bên thứ ba.
- Dự án có thể cần xây dựng một backend riêng cho Apple Watch, vì watchOS không hỗ trợ API socket BSD.
- Có người hỏi dự án xử lý quản lý trạng thái như thế nào và VDOM có phải là biểu diễn trung gian (IR) của mã SwiftUI hay không.
- Điểm khác biệt giữa dự án này với Lynx và React Native là nó không sử dụng mã kiểu XML để điều khiển UI, mà là một cách viết thay thế cho mã SwiftUI.
Tôi đã xem Gemini CLI ảo giác và xóa các tập tin của tôi #
I watched Gemini CLI hallucinate and delete my files
https://anuraag2601.github.io/gemini_cli_disaster.html
Bài viết này kể về một loạt vấn đề mà tác giả gặp phải khi sử dụng Gemini CLI, dẫn đến trải nghiệm mất file. Tác giả ban đầu sử dụng Claude Code (CC) để viết code, nhưng cân nhắc vấn đề chi phí, nên quyết định thử Gemini CLI. Tác giả đã thực hiện một thử nghiệm quản lý file đơn giản trong thư mục thử nghiệm có tên “claude-code-experiments”, nhưng kết quả thử nghiệm lại biến thành một trường hợp thất bại đáng lo ngại của AI.
Tác giả đầu tiên đưa ra cho Gemini một lệnh đơn giản: đổi tên thư mục hiện tại thành “AI CLI experiments” và di chuyển tất cả các file vào thư mục “anuraag_xyz project”. Gemini nhận ra rằng không thể đổi tên thư mục hiện tại và đưa ra một giải pháp hợp lý: trước tiên tạo thư mục “anuraag_xyz project”, sau đó di chuyển các file từ thư mục hiện tại sang đó. Tuy nhiên, sau khi thực thi lệnh tạo thư mục mới, Gemini đã hiểu sai kết quả lệnh là thành công và tạo một thư mục mới trong hệ thống file.
Sau đó, Gemini bắt đầu di chuyển các file vào thư mục mới này và báo cáo thao tác thành công. Nhưng khi tác giả kiểm tra desktop, thì không thấy thư mục “anuraag_xyz project”. Gemini, khi cố gắng xác minh sự tồn tại của thư mục, đã không thể liệt kê nội dung của desktop do giới hạn của sandbox bảo mật. Tác giả sau đó yêu cầu hoàn tác tất cả các thao tác, khôi phục về trạng thái trước đó.
Lúc này, “ảo giác” của Gemini đã xung đột với trạng thái thực tế của hệ thống file. Nó cố gắng di chuyển các file từ một thư mục không tồn tại trở lại thư mục gốc hiện đang trống. Sau nhiều lần thử không thành công, Gemini cuối cùng đã thừa nhận lỗi và nói rằng nó đã làm mất tất cả các file. Nó xin lỗi vì “thất bại hoàn toàn và thảm khốc” của mình và thừa nhận “sự bất lực nghiêm trọng” của mình.
Cuối bài viết, tác giả đã phân tích kỹ thuật các vấn đề có thể xảy ra. Anh ấy cho rằng vấn đề bắt đầu từ lệnh thao tác đầu tiên “mkdir”, Gemini có thể đã hiểu sai mã thoát hoặc đầu ra của lệnh. Ngoài ra, Gemini đã không xác minh trước và sau khi tạo thư mục, điều này vi phạm các thông lệ tốt nhất. Khi thư mục đích không tồn tại, lệnh “move” của Windows sẽ đổi tên file nguồn thành tên đích và tạo một file cùng tên trong thư mục hiện tại, dẫn đến mất dữ liệu thảm khốc.
HN | Độ nóng: 288 điểm | 351 bình luận | Tác giả: anuraag2601 #
https://news.ycombinator.com/item?id=44651485
- Gemini Pro 2.5 thể hiện sự lạc quan hoặc bi quan cực đoan trong các cuộc hội thoại, ảnh hưởng đến tâm trạng của người dùng.
- Gemini Pro 2.5 giúp người dùng chuyển đổi bức tường các chữ viết tắt phức tạp thành sơ yếu lý lịch cho một công việc cụ thể, thể hiện xuất sắc.
- Gemini Pro 2.5 đôi khi hiểu nhu cầu của người dùng tốt hơn con người trong các lời khuyên nghề nghiệp.
- Gemini Pro 2.5 cung cấp phản hồi sâu sắc trong các đề xuất thiết kế kiến trúc, không phải lúc nào cũng đồng ý với người dùng.
- Gemini Pro 2.5 với vai trò là “nhà phê bình cấp tiến” cung cấp các giải pháp thiết kế và kiến trúc tốt hơn các AI khác.
- Gemini Pro 2.5 thể hiện xuất sắc trong việc viết và chạy các dịch vụ Google Cloud Run.
- AI có khả năng tạo ra những ảnh hưởng khác nhau lên mọi người dựa trên dữ liệu huấn luyện.
- Có thể thao túng quần chúng thông qua việc huấn luyện các mô hình ngôn ngữ lớn (LLM).
- Các mô hình ChatGPT ban đầu đã chỉ trích một số nhân vật chính trị, trong khi vẫn im lặng về những người khác.
- AI mã nguồn mở giúp duy trì sự tồn tại của AI tốt, nhưng có thể dẫn đến tranh luận về tính xác thực của AI.
- Người dùng có thể dựa vào AI để tránh tự mình suy nghĩ.
- Hỗ trợ ra quyết định của AI tương tự như tung xúc xắc, quyền quyết định cuối cùng nằm trong tay người dùng.
- Kết quả tương tác của người dùng với Gemini Pro 2.5 thật đáng ngạc nhiên và hài lòng.
- Gemini Pro 2.5 đã giúp người dùng có được những công việc mà ban đầu họ nghĩ rằng mình không đủ tiêu chuẩn.
- Người dùng cho rằng Gemini Pro 2.5 đã đánh giá thấp giá trị kinh nghiệm của họ.
- Nhà tuyển dụng cần xem xét tiềm năng phát triển và giới hạn khả năng của nhân viên khi tuyển dụng.