2025-05-10 Hacker News Top Stories #
- Tác giả đã vô tình sử dụng địa chỉ email của Steve Jobs tại công ty NeXT, Steve Jobs đã trả lời “Ý tưởng tuyệt vời, cảm ơn” và kể lại kinh nghiệm của mình tại Apple cũng như cuộc trò chuyện với Tim Cook.
- LegoGPT là một phương pháp AI tạo ra các thiết kế Lego ổn định về mặt vật lý và có thể xây dựng được, hỗ trợ lắp ráp tự động, phù hợp với các nhu cầu thiết kế đa dạng.
- Reservoir Sampling là một thuật toán lấy mẫu ngẫu nhiên trong dữ liệu luồng, đảm bảo mỗi dữ liệu được chọn với xác suất như nhau, phù hợp để xử lý các tập dữ liệu lớn.
- CERN đã sử dụng LHC thành công trong việc biến chì thành vàng, tạo ra hạt nhân vàng-203 tồn tại trong thời gian ngắn, cung cấp những hiểu biết mới cho nghiên cứu phản ứng hạt nhân.
- Quỹ Khoa học Quốc gia Hoa Kỳ tái cơ cấu, bãi bỏ 37 bộ phận, có thể làm suy yếu ảnh hưởng của giám đốc bộ phận và chấm dứt một số dự án được tài trợ.
- WebAssembly 2.0 giới thiệu các tính năng mới như chỉ thị vector, kết quả đa giá trị, v.v., cải thiện hiệu suất, hỗ trợ môi trường sandbox an toàn và khả năng di động.
- Máy tính của kỹ sư phần mềm DOGE bị nhiễm phần mềm độc hại, đánh cắp thông tin đăng nhập, có thể ảnh hưởng đến tính bảo mật của CISA và hệ thống DOGE.
- Việc tháo rời thiết bị đầu cuối Starlink cho thấy chip bảo mật và tập lệnh khởi tạo, tiết lộ các rủi ro tiềm ẩn về an ninh mạng và chi tiết cấu tạo phần cứng.
- Sofie là một hệ thống tự động hóa tin tức truyền hình trực tiếp mã nguồn mở, giúp tổ chức phát thanh công cộng Na Uy sản xuất các chương trình trực tiếp một cách hiệu quả.
- Trình phân tích cú pháp Sep CSV đạt tốc độ phân tích cú pháp 21 GB/s thông qua SIMD và tối ưu hóa bộ xử lý mới, cải thiện đáng kể hiệu suất.
From: Steve Jobs. “Great idea, thank you.” #
https://blog.hayman.net/2025/05/06/from-steve-jobs-great-idea.html
Trang web này là một bài đăng trên blog của Steve Hayman, một cựu kỹ sư hệ thống tại NeXT và là cựu chỉ huy âm nhạc của ban nhạc Toronto Argonauts. Bài viết kể về một câu chuyện thú vị mà tác giả đã trải qua khi làm việc tại NeXT.

Tác giả nhớ lại rằng vào năm 1991, khi mới gia nhập NeXT, ông nhận thấy hệ thống email của công ty rất tiên tiến, hỗ trợ đa phương tiện, phông chữ, tệp đính kèm và âm thanh. Mỗi người dùng NeXT khi khởi động máy tính đều nhận được một email từ Steve Jobs, trong đó có một tệp âm thanh có tên là Lip Service. Tác giả cảm thấy tính năng này rất tuyệt.
Một ngày nọ, tác giả phát hiện ra rằng hệ thống email của công ty cho phép người dùng đăng ký bí danh, và ông nhận thấy rằng chưa ai sử dụng bí danh “steve@next.com”. Vì vậy, ông đã đăng ký bí danh này, và kết quả là hệ thống email tự động đặt nó làm hộp thư mặc định của ông. Tuy nhiên, tác giả nhanh chóng nhận ra rằng đây là một ý tưởng tồi tệ, vì nhiều người sẽ gửi email đến địa chỉ này, trong khi thực tế họ muốn gửi cho Steve Jobs.
Tác giả bắt đầu hoảng sợ, lo lắng rằng mình sẽ bị sa thải. Ông đã cố gắng thay đổi bí danh để trỏ đến hộp thư của Steve Jobs, nhưng vẫn cảm thấy rất lo lắng. Cuối cùng, ông quyết định thú nhận với Steve Jobs, gửi một email giải thích tình hình. Điều khiến ông ngạc nhiên là Steve Jobs đã trả lời email của ông, nội dung chỉ đơn giản là “Great idea, thank you”.
Tác giả rất trân trọng email này, cảm thấy đây là một cơ hội hiếm có. Bài viết cũng đề cập đến kinh nghiệm của tác giả khi làm việc tại Apple, cũng như cuộc trò chuyện của ông với Tim Cook. Tác giả cuối cùng đề cập rằng ông rất may mắn khi nhận được email từ Steve Jobs và Tim Cook trong sự nghiệp của mình.
Ở cuối bài viết, có một bình luận của độc giả kể về trải nghiệm giao tiếp của chính họ với Steve Jobs. Độc giả này đã từng gửi email cho Steve Jobs vào năm 2011, hỏi liệu có thêm phản hồi xúc giác vào iPhone hay không, và Steve Jobs đã trả lời rằng tính năng này sẽ nhanh chóng trở nên khó chịu, vì vậy sẽ không thêm vào.
HN | Nóng: 1108 điểm | 284 bình luận | Tác giả: mattl | 1 ngày trước #
https://news.ycombinator.com/item?id=43929724
- Tổ chức hỗ trợ CNTT của công ty có thể gặp khó khăn trong việc giải quyết các vấn đề phức tạp, khiến nhân viên khó giải quyết vấn đề
- Công ty có thể bị mất nhân viên và giảm năng suất do hỗ trợ CNTT kém
- Công ty có thể bị giảm chất lượng sản phẩm và khó cạnh tranh với các đối thủ do thiếu kế hoạch và chiến lược dài hạn
- Công ty có thể coi nhân viên là nguồn lực có thể thay thế, thay vì trân trọng những đóng góp và giá trị của họ
- Công ty có thể gây tổn hại lâu dài đến thương hiệu và danh tiếng của mình do quá chú trọng đến lợi ích ngắn hạn
- Công ty có thể gây ra sự thiếu tin tưởng và bất mãn giữa các nhân viên do thiếu minh bạch và giao tiếp
- Công ty có thể đưa ra các quyết định kỹ thuật sai lầm và giảm chất lượng sản phẩm do quá phụ thuộc vào nhân viên không có chuyên môn kỹ thuật
- Công ty có thể khiến sản phẩm và dịch vụ trở nên lỗi thời và kém hấp dẫn do thiếu đổi mới và sáng tạo
- Công ty có thể thiếu đổi mới và sáng tạo nội bộ do quá phụ thuộc vào các nguồn lực bên ngoài
- Công ty có thể khiến nhân viên thiếu kỹ năng và kiến thức do thiếu phát triển và đào tạo nhân viên
- Công ty có thể khiến nhân viên làm việc quá sức và căng thẳng do quá chú trọng đến lợi nhuận
LegoGPT: Generating Physically Stable and Buildable Lego #
https://avalovelace1.github.io/LegoGPT/
LegoGPT là một phương pháp có khả năng tạo ra các thiết kế Lego ổn định về mặt vật lý và có thể xây dựng được từ các gợi ý văn bản. Nó thực hiện điều này bằng cách xây dựng một tập dữ liệu lớn về các thiết kế Lego ổn định về mặt vật lý và các chú thích liên quan, đồng thời huấn luyện một mô hình ngôn ngữ tự hồi quy lớn để dự đoán khối Lego tiếp theo cần thêm vào. Để cải thiện tính ổn định của các thiết kế được tạo ra, LegoGPT sử dụng các cơ chế kiểm tra tính hợp lệ hiệu quả và quay lui nhận biết vật lý, sử dụng các định luật vật lý và các ràng buộc lắp ráp để loại bỏ các dự đoán token không khả thi.
Quy trình làm việc của LegoGPT bao gồm việc mã hóa thiết kế Lego thành một chuỗi token văn bản, được sắp xếp theo thứ tự quét raster từ dưới lên. Sau đó, nó tạo ra một tập dữ liệu hướng dẫn, ghép nối các chuỗi khối Lego với các mô tả, để tinh chỉnh mô hình ngôn ngữ LLaMA-3.2-Instruct-1B. Trong quá trình suy luận, LegoGPT tạo ra các thiết kế Lego bằng cách dự đoán từng khối Lego một, dựa trên một gợi ý văn bản. Đối với mỗi khối Lego được tạo ra, LegoGPT thực hiện kiểm tra tính hợp lệ để đảm bảo rằng nó có định dạng tốt, tồn tại trong thư viện khối Lego và không va chạm với các khối Lego hiện có.
LegoGPT có khả năng tạo ra các thiết kế Lego đa dạng và đẹp mắt, tương ứng chặt chẽ với các gợi ý văn bản đầu vào. Nó cũng có thể sử dụng cánh tay robot để tự động lắp ráp các thiết kế Lego được tạo ra. Ngoài ra, LegoGPT còn phát triển một phương pháp tạo vân Lego dựa trên văn bản, có khả năng tạo ra các thiết kế Lego có màu sắc và vân. Những thiết kế này có thể được lắp ráp thủ công bởi con người hoặc tự động lắp ráp bằng cánh tay robot.
Tập dữ liệu StableText2Lego của LegoGPT chứa hơn 47.000 cấu trúc Lego và 28.000 đối tượng 3D độc đáo, cùng với các chú thích chi tiết. Tập dữ liệu này được tạo ra bằng cách voxel hóa và lego hóa các lưới ShapeNetCore, đồng thời lọc bỏ các thiết kế không ổn định về mặt vật lý thông qua việc ngẫu nhiên hóa bố cục khối Lego và phân tích độ ổn định. Mã và mô hình của LegoGPT cũng được công bố công khai để các nhà nghiên cứu và nhà phát triển sử dụng.
HN | Nóng: 538 điểm | 136 bình luận | Tác giả: nkko | 19 giờ trước #
https://news.ycombinator.com/item?id=43933891
- Việc tạo và tối ưu hóa các khả năng được thực hiện trong một tập hợp các ràng buộc cụ thể theo miền, được lập trình thủ công.
- Sử dụng các định luật vật lý và ràng buộc lắp ráp để cải thiện tính ổn định của các thiết kế được tạo ra.
- Coi việc thiết kế không gian vấn đề và tập hợp các ràng buộc là công việc thú vị nhất.
- Việc tạo và tối ưu hóa các khả năng được thực hiện trong một tập hợp các ràng buộc cụ thể theo miền, được lập trình thủ công, ví dụ như tối ưu hóa đèn giao thông.
- Giới hạn các đầu ra được tạo ra trong một tập hợp các giải pháp có thể chấp nhận được, ví dụ như sử dụng JSON schema.
- Sử dụng học tăng cường để hệ thống tuân thủ các quy tắc an toàn.
- Coi mô hình như một công cụ tìm kiếm và xác thực, thay vì một công cụ dự đoán từ.
- Xác định không gian vấn đề sao cho mô hình chỉ có thể tạo ra các giải pháp hữu ích.
Reservoir Sampling #
https://samwho.dev/reservoir-sampling/
Reservoir Sampling (Lấy mẫu hồ chứa) là một kỹ thuật chọn mẫu ngẫu nhiên khi không biết kích thước của tập mẫu. Kỹ thuật này đặc biệt hữu ích trong một số trường hợp, chẳng hạn như khi bạn cần chọn một mẫu ngẫu nhiên từ một tập dữ liệu rất lớn, nhưng bạn không biết kích thước của tập dữ liệu đó.
Trong một ví dụ đơn giản, giả sử bạn có 10 lá bài và bạn cần chọn 3 lá. Một cách là xáo trộn tất cả các lá bài và sau đó chọn 3 lá đầu tiên. Một cách khác là sử dụng trình tạo số ngẫu nhiên để chọn 3 chỉ mục, các lá bài tương ứng với các chỉ mục này là những lá bạn chọn.
Tuy nhiên, nếu bạn không biết kích thước của tập dữ liệu, các phương pháp trên không phù hợp. Ví dụ, giả sử bạn cần chọn một mẫu ngẫu nhiên từ một luồng dữ liệu, bạn không biết kích thước luồng dữ liệu. Lúc này, Reservoir Sampling có thể phát huy tác dụng.
Ý tưởng cơ bản của Reservoir Sampling là duy trì một bộ đệm có kích thước cố định (gọi là hồ chứa), dùng để lưu trữ các mẫu đã chọn. Khi dữ liệu mới đến, bạn có thể chọn thêm nó vào hồ chứa hoặc loại bỏ. Xác suất chọn thêm vào hồ chứa được tính dựa trên kích thước của hồ chứa và chỉ mục của dữ liệu hiện tại.
Trong một ví dụ cụ thể, giả sử bạn cần chọn một mẫu ngẫu nhiên từ một luồng nhật ký, bạn không biết kích thước luồng nhật ký. Bạn có thể sử dụng Reservoir Sampling để chọn một mẫu ngẫu nhiên. Mỗi khi nhật ký mới đến, bạn có thể chọn thêm nó vào hồ chứa hoặc loại bỏ. Xác suất chọn thêm vào hồ chứa được tính dựa trên kích thước của hồ chứa và chỉ mục của nhật ký hiện tại.
Ưu điểm của Reservoir Sampling là nó có thể chọn một mẫu ngẫu nhiên mà không cần biết kích thước của tập dữ liệu, và độ phức tạp thời gian của nó là O(n), độ phức tạp không gian là O(k), trong đó n là kích thước của tập dữ liệu, k là kích thước của hồ chứa. Do đó, Reservoir Sampling là một thuật toán lấy mẫu ngẫu nhiên rất hiệu quả.
Trong ứng dụng thực tế, Reservoir Sampling có thể được sử dụng trong nhiều tình huống, chẳng hạn như lấy mẫu nhật ký, phân tích dữ liệu, Machine Learning, v.v. Nó có thể giúp bạn chọn một mẫu ngẫu nhiên từ một tập dữ liệu rất lớn, từ đó giảm thời gian và độ phức tạp không gian xử lý dữ liệu.
HN | Nóng: 495 điểm | 101 bình luận | Tác giả: chrisdemarco | 1 ngày trước #
https://news.ycombinator.com/item?id=43928315
- Số liệu thống kê có thể không đáng tin cậy, thậm chí có thể được bịa đặt.
- Không nên nhầm lẫn số liệu thống kê với dự đoán, bản thân số liệu thống kê là đáng tin cậy, nhưng mối quan hệ của nó với hành vi trong tương lai là không chắc chắn.
- Tác giả chia sẻ một câu chuyện về cách ước tính số lượng quần thể chim, nhấn mạnh tầm quan trọng của số liệu thống kê.
- Có một thuật toán gọi là Reservoir Sampling, được sử dụng để lấy mẫu ngẫu nhiên từ các tập dữ liệu lớn.
- Reservoir Sampling có thể được tối ưu hóa bằng cách tạo ra các số ngẫu nhiên phân phối hình học, giảm lượng dữ liệu cần truy cập.
- Thuật toán chọn k phần tử hàng đầu có thể được triển khai bằng bộ đệm không theo thứ tự và thuật toán quickselect để đạt được độ phức tạp thời gian O(n) và độ phức tạp không gian O(k).
- Phương pháp Alias là một thuật toán để lấy mẫu từ phân phối ngẫu nhiên rời rạc, có hiệu quả và chính xác.
- Một số thuật toán có thể được sử dụng để mô phỏng heapsort, đạt được độ phức tạp thời gian O(n).
- Trực quan hóa các thuật toán sắp xếp có thể giúp hiểu cách thức hoạt động và tối ưu hóa của thuật toán.
ALICE detects the conversion of lead into gold at the LHC #
https://www.home.cern/news/news/physics/alice-detects-conversion-lead-gold-lhc
Tổ chức Nghiên cứu Hạt nhân Châu Âu (CERN) gần đây đã thực hiện một thí nghiệm, sử dụng Máy Va chạm Hadron Lớn (LHC) để chuyển đổi chì thành vàng. Thí nghiệm này được thực hiện bởi nhóm hợp tác ALICE, họ đã sử dụng các vụ va chạm hạt nhân chì trong LHC để tạo ra các trường điện từ mạnh, từ đó chuyển đổi chì thành vàng.

Chì và vàng là hai nguyên tố hóa học khác nhau, chì là một kim loại màu xám tương đối phổ biến, trong khi vàng là một kim loại màu vàng quý giá. Các nhà giả kim thuật thời trung cổ đã từng cố gắng chuyển đổi chì thành vàng, nhưng phương pháp của họ đều dựa trên các phản ứng hóa học và không thể thay đổi tính chất của các nguyên tố. Tuy nhiên, với sự phát triển của vật lý hạt nhân, các nhà khoa học đã phát hiện ra rằng có thể chuyển đổi một nguyên tố thành một nguyên tố khác thông qua các phản ứng hạt nhân.
Trong thí nghiệm này, nhóm hợp tác ALICE đã sử dụng các vụ va chạm hạt nhân chì trong LHC để tạo ra các trường điện từ mạnh. Trường điện từ này có thể tương tác với hạt nhân chì, gây ra sự rung động của cấu trúc bên trong hạt nhân chì, từ đó đẩy một vài proton và neutron ra khỏi hạt nhân chì. Bằng cách này, chì có thể được chuyển đổi thành các nguyên tố khác, bao gồm cả vàng.
Kết quả thí nghiệm cho thấy LHC có thể tạo ra một lượng lớn hạt nhân vàng, khoảng 89.000 hạt nhân vàng mỗi giây. Tuy nhiên, tuổi thọ của những hạt nhân vàng này rất ngắn, chúng phân rã gần như ngay lập tức thành các proton, neutron và các hạt khác. Mặc dù vậy, thí nghiệm này vẫn là một bước quan trọng trong việc chuyển đổi chì thành vàng.
Thí nghiệm này không chỉ có thể giúp các nhà khoa học hiểu rõ hơn về cơ chế của các phản ứng hạt nhân, mà còn có thể cung cấp tài liệu tham khảo cho các máy va chạm hạt với năng lượng cao hơn trong tương lai. Đồng thời, thí nghiệm này cũng có thể giúp các nhà khoa học hiểu rõ hơn về nguồn gốc và sự tiến hóa của vũ trụ, vì các phản ứng hạt nhân tương tự có thể xảy ra trong vũ trụ sơ khai.
Tóm lại, thí nghiệm của Tổ chức Nghiên cứu Hạt nhân Châu Âu (CERN) sử dụng Máy Va chạm Hadron Lớn (LHC) để chuyển đổi chì thành vàng là một đột phá khoa học quan trọng. Thí nghiệm này có thể giúp các nhà khoa học hiểu rõ hơn về cơ chế của các phản ứng hạt nhân và cung cấp tài liệu tham khảo cho các máy va chạm hạt với năng lượng cao hơn trong tương lai. Đồng thời, thí nghiệm này cũng có thể giúp các nhà khoa học hiểu rõ hơn về nguồn gốc và sự tiến hóa của vũ trụ.
HN | Nóng: 468 điểm | 249 bình luận | Tác giả: miiiiiike | 10 giờ trước #
https://news.ycombinator.com/item?id=43937214
- Máy gia tốc hạt lớn (LHC) có thể biến chì thành vàng, nhưng vàng được tạo ra là vàng-203, có tính phóng xạ và sẽ phân rã thành thủy ngân-203 trong vòng một phút.
- Lượng vàng được tạo ra bằng cách chuyển đổi này là rất nhỏ, giá trị gần như bằng không.
- Ngay cả khi máy gia tốc hạt lớn có thể tạo ra một lượng lớn vàng, thì cũng cần phải xem xét đến sự tiêu thụ vàng của chính thiết bị.
- Các nguyên tử có thể được tạo ra hoặc phá hủy trong các máy gia tốc hạt, các ngôi sao và siêu tân tinh, nhưng trong các trường hợp khác, các nguyên tử không thể được tạo ra hoặc phá hủy.
- Lỗ đen có thể thay đổi vật chất, nhưng các quy luật vật lý bên trong nó hiện vẫn chưa rõ ràng.
- Ngay cả khi có thể sản xuất vàng với số lượng lớn, thì cũng không có khả năng thu được lợi ích kinh tế thông qua phương pháp này.
- Lượng vàng được tạo ra bởi máy gia tốc hạt lớn là cực kỳ nhỏ so với khối lượng nước trong đại dương.
- Năng lượng cần thiết để đun sôi toàn bộ nước trong đại dương có thể được sử dụng để tạo ra một lượng nhỏ vàng.
- Vàng có thể được chuyển đổi thành thủy ngân bằng cách bắn phá bằng neutron, nhưng phương pháp này không hiệu quả về mặt kinh tế.
NSF faces shake-up as officials abolish its 37 divisions #
Quỹ Khoa học Quốc gia Hoa Kỳ (NSF) sắp phải đối mặt với một cuộc tái cấu trúc lớn. Theo các nguồn tin, 37 bộ phận của NSF sẽ bị bãi bỏ, giám đốc và phó giám đốc đương nhiệm sẽ mất chức danh và có thể được tái phân công sang các vị trí khác. Cuộc tái cấu trúc này dường như chịu sự chỉ đạo từ Nhà Trắng, yêu cầu cắt giảm ngân sách của NSF. Quyết định của NSF có thể là để thích ứng với quy trình xem xét mới, bổ sung thêm một lớp quy trình xem xét mới.
NSF nhận được hơn 40.000 đề xuất mỗi năm, và khoảng một phần tư trong số đó được tài trợ. Giám đốc bộ phận có quyền lực lớn trong việc quyết định kết quả tài trợ. Trách nhiệm chính của họ là đồng ý hoặc không đồng ý với các đề xuất tài trợ. Tuy nhiên, quy trình xem xét mới có thể thay đổi điều này. Được biết, NSF sẽ tiến hành xem xét sơ bộ tất cả các đề xuất, và nếu phát hiện một đề xuất không tuân thủ chỉ thị của tổng thống về sự đa dạng, công bằng và hòa nhập, người quản lý chương trình có thể điều chỉnh nhỏ đề xuất để đáp ứng các yêu cầu.
Việc tái cấu trúc NSF có thể có tác động lớn đến quy trình tài trợ của tổ chức. Một số người lo ngại rằng, tổ chức sau tái cấu trúc có thể dễ bị áp lực từ Nhà Trắng hơn, tài trợ cho các dự án nghiên cứu phù hợp với ý thức hệ của họ. Quyết định của NSF có thể dẫn đến việc giảm số lượng vị trí làm việc trong tổ chức, và hiện vẫn chưa rõ điều này sẽ ảnh hưởng đến hoạt động của tổ chức như thế nào.
Ngoài ra, NSF cũng sẽ chấm dứt một số dự án tài trợ đã được trao. Theo các nguồn tin, tổ chức đã chấm dứt gần 1400 dự án tài trợ, trị giá hơn 1 tỷ đô la Mỹ. Quyết định này có thể có tác động lớn đến các nhà nghiên cứu và dự án bị ảnh hưởng.
Nhìn chung, việc tái cấu trúc NSF có thể có tác động lớn đến quy trình tài trợ, vị trí làm việc và dự án nghiên cứu của tổ chức. Mặc dù quyết định của tổ chức có thể là để thích ứng với quy trình xem xét mới và yêu cầu ngân sách, nhưng nó cũng làm dấy lên lo ngại về tính độc lập của tổ chức và quá trình ra quyết định tài trợ.
HN | Nóng: 437 điểm | 577 bình luận | Tác giả: magicalist | 12 giờ trước #
https://news.ycombinator.com/item?id=43935913
- Các quyết định của chính phủ Hoa Kỳ thường dựa trên thông tin không chính xác, trong khi nhân viên thực tế hiểu rõ hơn về tình hình.
- Hành động của chính phủ Hoa Kỳ là cố ý phá hoại chức năng của chính phủ để làm suy yếu lòng tin của công chúng.
- Chính sách của chính phủ Hoa Kỳ sẽ thúc đẩy sự đổi mới rời khỏi Hoa Kỳ và chuyển sang các quốc gia khác.
- Hành động của chính phủ Hoa Kỳ là do lý do ý thức hệ, chứ không thực sự quan tâm đến chi tiêu của chính phủ.
- Chính sách của chính phủ Hoa Kỳ sẽ khiến những người trẻ tuổi khó tiếp cận với nghiên cứu khoa học và đổi mới tiên tiến.
- Hành động của chính phủ Hoa Kỳ là cố ý phá hoại nền kinh tế Hoa Kỳ và vị thế dẫn đầu toàn cầu.
- Chính sách của chính phủ Hoa Kỳ sẽ dẫn đến chất lượng dịch vụ giảm sút, công chúng sẽ nghi ngờ việc sử dụng tiền thuế.
- Hành động của chính phủ Hoa Kỳ là do ích kỷ và thiển cận, chứ không thực sự quan tâm đến tương lai của đất nước.
- Chính sách của chính phủ Hoa Kỳ sẽ dẫn đến chảy máu chất xám và suy giảm khả năng đổi mới.
- Hành động của chính phủ Hoa Kỳ là ngu ngốc và có hại, và nên bị ngăn chặn.
WASM 2.0 #
https://www.w3.org/TR/wasm-core-2/
WebAssembly (viết tắt là Wasm) là một định dạng mã cấp thấp, an toàn, có thể di động, được thiết kế để thực thi hiệu quả và biểu diễn nhỏ gọn. Tài liệu này mô tả phiên bản 2.0 của tiêu chuẩn cốt lõi WebAssembly, bao gồm các mục tiêu thiết kế, phạm vi, cân nhắc về bảo mật và các phụ thuộc của nó.
Các mục tiêu thiết kế của WebAssembly bao gồm cung cấp một môi trường sandbox an toàn, đảm bảo việc thực thi mã không gây hại cho môi trường máy chủ; cung cấp một định dạng mã có thể di động, cho phép mã chạy trên các nền tảng và thiết bị khác nhau; và cung cấp một môi trường thực thi hiệu quả, cho phép thực thi mã nhanh chóng. Phạm vi của WebAssembly bao gồm định nghĩa một định dạng nhị phân để biểu diễn mã và dữ liệu; định nghĩa một định dạng văn bản để biểu diễn mã và dữ liệu; và định nghĩa một tập hợp các API để tương tác với môi trường máy chủ.
Các cân nhắc về bảo mật của WebAssembly bao gồm đảm bảo việc thực thi mã không gây hại cho môi trường máy chủ; đảm bảo việc thực thi mã không làm rò rỉ thông tin nhạy cảm; và đảm bảo việc thực thi mã không bị mã độc phá hoại. Các phụ thuộc của WebAssembly bao gồm phụ thuộc vào các API và dịch vụ do môi trường máy chủ cung cấp; phụ thuộc vào môi trường thực thi của mã; và phụ thuộc vào các thư viện và framework phụ thuộc của mã.
Các khái niệm cốt lõi của WebAssembly bao gồm giá trị, kiểu, lệnh, module và instance. Giá trị là đơn vị cơ bản của việc thực thi mã WebAssembly, bao gồm số nguyên, số dấu phẩy động, chuỗi và các kiểu dữ liệu khác. Kiểu là kiểu dữ liệu được sử dụng trong mã WebAssembly, bao gồm kiểu số nguyên, kiểu dấu phẩy động, kiểu chuỗi và các kiểu khác. Lệnh là các thao tác cơ bản được sử dụng trong mã WebAssembly, bao gồm lệnh số học, lệnh logic, lệnh điều khiển luồng và các loại lệnh khác. Module là đơn vị tổ chức của mã WebAssembly, bao gồm một tập hợp các hàm, bảng, bộ nhớ và biến toàn cục. Instance là một thể hiện thực thi của một module WebAssembly, bao gồm một tập hợp các thể hiện của hàm, bảng, bộ nhớ và biến toàn cục.
Quá trình thực thi của WebAssembly bao gồm tải module, khởi tạo module, thực thi mã và lưu trữ dữ liệu. Tải module là tải module WebAssembly vào bộ nhớ; khởi tạo module là tạo một instance của module WebAssembly; thực thi mã là thực thi mã WebAssembly; lưu trữ dữ liệu là lưu trữ kết quả thực thi mã WebAssembly.
Định dạng nhị phân của WebAssembly là định dạng được sử dụng để biểu diễn mã và dữ liệu WebAssembly, bao gồm magic number, số phiên bản, section và nội dung section. Magic number là định danh của định dạng nhị phân WebAssembly; số phiên bản là phiên bản của định dạng nhị phân WebAssembly; section là đơn vị cơ bản của định dạng nhị phân WebAssembly, bao gồm section kiểu, section hàm, section bảng, section bộ nhớ và section toàn cục; nội dung section là nội dung của section, bao gồm kiểu, hàm, bảng, bộ nhớ và biến toàn cục.
Định dạng văn bản của WebAssembly là định dạng được sử dụng để biểu diễn mã và dữ liệu WebAssembly, bao gồm module, hàm, bảng, bộ nhớ và biến toàn cục. Module là đơn vị tổ chức của mã WebAssembly; hàm là hàm được sử dụng trong mã WebAssembly; bảng là bảng được sử dụng trong mã WebAssembly; bộ nhớ là bộ nhớ được sử dụng trong mã WebAssembly; biến toàn cục là biến toàn cục được sử dụng trong mã WebAssembly.
API của WebAssembly là API được sử dụng để tương tác với môi trường máy chủ, bao gồm module API, hàm API, bảng API, bộ nhớ API và biến toàn cục API. Module API là API được sử dụng để tạo và quản lý module WebAssembly; hàm API là API được sử dụng để tạo và quản lý hàm WebAssembly; bảng API là API được sử dụng để tạo và quản lý bảng WebAssembly; bộ nhớ API là API được sử dụng để tạo và quản lý bộ nhớ WebAssembly; biến toàn cục API là API được sử dụng để tạo và quản lý biến toàn cục WebAssembly.
HN | Nóng: 298 điểm | 129 bình luận | Tác giả: lioeters | 16 giờ trước #
https://news.ycombinator.com/item?id=43934711
- Việc phát hành WASM 2.0 mang đến nhiều tính năng mới, bao gồm các chỉ thị vectơ, chỉ thị bộ nhớ hàng loạt, kết quả đa giá trị, kiểu tham chiếu, chuyển đổi không bắt giữ và chỉ thị mở rộng dấu.
- Việc giới thiệu các chỉ thị SIMD có thể cải thiện hiệu suất của một số ứng dụng chuyên sâu về tính toán, nhưng cũng có thể gây ra các vấn đề về khả năng tương thích.
- Rust và LLVM hiện chưa tận dụng hết các tính năng kết quả đa giá trị của WASM 2.0, do các vấn đề về khả năng tương thích ABI.
- Một số nhà phát triển cho rằng các chỉ thị SIMD của WASM 2.0 chưa đủ hoàn thiện và nên áp dụng các giải pháp vector hóa linh hoạt hơn.
- WASM 3.0 đang được phát triển và có thể được phát hành trong thời gian tới.
- Một số nhà phát triển lạc quan về hiệu suất và khả năng tương thích của WASM 2.0, tin rằng nó có thể mang lại những cải tiến đáng kể về hiệu suất.
- Tính năng kết quả đa giá trị của WASM 2.0 có thể cải thiện hiệu quả gọi hàm, nhưng trong một số trường hợp có thể không dễ thực hiện.
- Một số nhà phát triển tin rằng các chỉ thị vector hóa của WASM 2.0 có thể giúp cải thiện hiệu suất xử lý chuỗi và thuật toán.
Doge software engineer’s computer infected by info-stealing malware #
Trang web này là một bài viết về an ninh mạng, chủ yếu kể về sự kiện máy tính của một kỹ sư phần mềm tên là Kyle Schutt bị nhiễm phần mềm độc hại đánh cắp thông tin. Schutt làm việc tại Cơ quan An ninh Mạng và Cơ sở Hạ tầng An ninh Hoa Kỳ (CISA) và Bộ Hiệu quả Chính phủ (DOGE), có thể sở hữu thông tin nhạy cảm. Thông tin đăng nhập của anh ta đã nhiều lần xuất hiện trong nhật ký phần mềm độc hại công khai, cho thấy thiết bị của anh ta có thể đã bị tấn công bởi tin tặc.
Bài viết đề cập rằng thông tin đăng nhập của Schutt đã xuất hiện trong ít nhất bốn nhật ký phần mềm độc hại công khai, những nhật ký này thường lây nhiễm thiết bị thông qua Trojan, lừa đảo hoặc lỗ hổng phần mềm. Các phần mềm độc hại này không chỉ có thể đánh cắp thông tin đăng nhập mà còn có thể ghi lại thao tác gõ phím và đầu ra màn hình. Dữ liệu này có thể được gửi bởi kẻ tấn công đến các kho chứa thông tin đăng nhập công khai.
Nhà báo Micah Lee cho biết, thông tin đăng nhập tài khoản Gmail của Schutt đã xuất hiện trong 51 vụ rò rỉ dữ liệu và 5 lần dán công khai, những dữ liệu này đến từ các vụ rò rỉ của các trang web như Adobe, LinkedIn, Gravatar và The Post Millennial. Mặc dù những thông tin đăng nhập này có thể được công khai thông qua rò rỉ cơ sở dữ liệu, nhưng khả năng Schutt sử dụng thông tin đăng nhập tương tự hoặc giống nhau trong hệ thống CISA và DOGE khiến kẻ tấn công có thể đã có được thông tin nhạy cảm.
Bài viết cũng đề cập rằng, những người chỉ trích DOGE cho rằng sự kiện này phù hợp với các lỗi bảo mật hoạt động khác của văn phòng này, chẳng hạn như trang web có thể bị bất kỳ ai chỉnh sửa và việc truy cập không phù hợp vào dữ liệu chính phủ. Những người chỉ trích nghi ngờ rằng bảo mật kém của DOGE có thể là cố ý, nhằm mục đích tiết lộ bí mật cho một nhóm người cụ thể.
Cuối cùng, bài viết đề cập rằng CISA và Bộ An ninh Nội địa đã không trả lời ngay lập tức yêu cầu bình luận về sự kiện này. Tác giả bài viết, Dan Goodin, là biên tập viên an ninh cấp cao của Ars Technica, ông tập trung vào các chủ đề như an ninh mạng, phần mềm độc hại và bảo mật mật khẩu.
HN | Nóng: 279 điểm | 152 bình luận | Tác giả: lysp | 17 giờ trước #
https://news.ycombinator.com/item?id=43934540
- Các vấn đề bảo mật của DOGE có thể là cố ý, chứ không đơn thuần là do sự bất tài.
- Dao cạo của Hanlon (Hanlon’s razor) không thể là cơ sở để đưa ra quyết định, nên xem xét nhiều khả năng khác nhau.
- Có người cho rằng các vấn đề bảo mật của DOGE là do sự bất tài của kỹ sư, nhưng cũng có thể là do ai đó cố ý gây ra.
- Các lỗ hổng bảo mật của DOGE có thể bị một quốc gia hoặc tổ chức cụ thể lợi dụng.
- Các vấn đề bảo mật của DOGE có thể là do quyết định của ban quản lý, chứ không phải do lỗi của kỹ sư.
- Có người cho rằng các vấn đề bảo mật của DOGE là do thiếu ý thức và kinh nghiệm về bảo mật.
- Các lỗ hổng bảo mật của DOGE có thể bị sử dụng cho mục đích chính trị.
- Có người cho rằng các vấn đề bảo mật của DOGE là do không coi trọng bảo mật.
- Các vấn đề bảo mật của DOGE có thể bị sử dụng cho lợi ích kinh tế.
- Có người cho rằng các vấn đề bảo mật của DOGE là do sự tham nhũng của ban quản lý.
Starlink User Terminal Teardown #
https://www.darknavy.org/blog/a_first_glimpse_of_the_starlink_user_ternimal/
Bài viết này là một khảo sát sơ bộ về thiết bị đầu cuối người dùng Starlink. Starlink là một dịch vụ internet vệ tinh quỹ đạo Trái Đất thấp (LEO) do SpaceX cung cấp. Người dùng kết nối với các vệ tinh quỹ đạo thấp thông qua thiết bị đầu cuối người dùng, sau đó kết nối với internet thông qua các cổng mặt đất. Với việc thế hệ vệ tinh mới dần áp dụng liên kết laser, một số vệ tinh có thể giao tiếp với nhau bằng laser, điều này làm giảm sự phụ thuộc vào các trạm mặt đất, cải thiện hiệu quả truyền tải và tăng cường khả năng phủ sóng toàn cầu.
Phân tích phần cứng cho thấy, một thiết bị đầu cuối người dùng Starlink hoàn chỉnh bao gồm hai phần: bộ định tuyến và ăng-ten. Bài viết này tập trung vào phân tích phần ăng-ten (User Terminal Antenna, gọi tắt là UTA). Các nhà nghiên cứu đã mua một bộ thiết bị đầu cuối người dùng Starlink Standard Actuated (còn gọi là Rev3 hoặc GenV2) từ Singapore và tháo rời phần ăng-ten. Sau khi tháo rời, họ phát hiện ra rằng PCB của UTA chiếm gần như toàn bộ vỏ, chủ yếu bao gồm chip RF front-end và các thành phần điều khiển cốt lõi do STMicroelectronics sản xuất.
Các nhà nghiên cứu cũng đã trích xuất firmware và tiến hành phân tích. Họ trực tiếp trích xuất firmware từ chip eMMC và phát hiện ra rằng phần lớn nội dung firmware không được mã hóa. Phân tích cho thấy, firmware bao gồm chuỗi khởi động, kernel và phần hệ thống tệp không được mã hóa. Phân tích sâu hơn cho thấy, sau khi kernel khởi động, nó sẽ đọc phần lớn môi trường hoạt động từ eMMC và giải nén vào thư mục /sx/local/runtime.
Phân tích firmware cũng cho thấy, ngăn xếp phần mềm Starlink chủ yếu dựa vào chương trình C++ trong không gian người dùng để xử lý các gói mạng, bỏ qua kernel. Linux kernel chủ yếu cung cấp trình điều khiển phần cứng cơ bản và quản lý tiến trình. Các nhà nghiên cứu cũng phát hiện ra một số chức năng dường như thuộc về vệ tinh hoặc trạm mặt đất, kỹ thuật đảo ngược sơ bộ cho thấy, khi khởi động, hệ thống sẽ xác định loại thiết bị dựa trên các thiết bị ngoại vi phần cứng, sau đó tải và thực thi logic tương ứng.
Ngoài ra, các nhà nghiên cứu còn xây dựng một môi trường mô phỏng dựa trên QEMU để tạo điều kiện thuận lợi cho việc phân tích firmware UTA. Trong môi trường này, họ đã chạy và gỡ lỗi thành công một số phần mềm, bao gồm httpd, WebSocket và gRPC service.
UTA cũng chứa một chip bảo mật chuyên dụng, STSAFE-A110, chip này có cấp độ bảo mật CC EAL5+. Chip này cung cấp một định danh thiết bị duy nhất, chứng chỉ khóa công khai và dẫn xuất khóa mã hóa đối xứng. Các nhà nghiên cứu cũng phát hiện ra một chương trình có tên là Ethernet Data Recorder, chương trình này có thể được sử dụng để ghi lại các gói mạng. Tuy nhiên, phân tích sâu hơn cho thấy, chương trình này chủ yếu được sử dụng để ghi lại dữ liệu đo từ xa của vệ tinh, chứ không phải dữ liệu người dùng.
Cuối cùng, các nhà nghiên cứu chỉ ra rằng, với sự phát triển không ngừng của công nghệ vệ tinh và ứng dụng vào các ngành khác nhau, mọi thành phần của Starlink và các hệ thống internet vệ tinh khác đều có thể trở thành chiến trường quan trọng cho các hoạt động tấn công và phòng thủ trong tương lai. Các nhà phát triển và hacker không chỉ cạnh tranh trong lĩnh vực kỹ thuật số mà còn phải đối mặt với những ràng buộc vật lý của vũ trụ.
HN | Nóng: 279 điểm | 96 bình luận | Tác giả: walterbell | 21 giờ trước #
https://news.ycombinator.com/item?id=43933452
- Tập lệnh khởi tạo của thiết bị đầu cuối người dùng Starlink tự động ghi 41 khóa công khai SSH, điều này có thể làm dấy lên lo ngại về tính bảo mật của thiết bị đầu cuối người dùng
- Một số người cho rằng điều này không khác biệt nhiều so với việc các ISP cung cấp router có hệ thống quản lý từ xa
- Một số quốc gia ở Châu Âu yêu cầu các ISP cho phép người dùng sử dụng router hoặc MODEM của riêng họ, nhưng tình huống này có thể không áp dụng cho tất cả các loại công nghệ mạng
- Việc sử dụng MODEM hoặc router của riêng bạn có thể dẫn đến việc ISP không cung cấp hỗ trợ kỹ thuật
- Một số người cho rằng, ISP có thể kiểm soát thiết bị của người dùng bằng các phương tiện khác, chẳng hạn như giao thức TR-069
- Việc sử dụng GPON SFP hoặc DOCSIS MODEM của riêng bạn có thể khả thi, nhưng cần đáp ứng các yêu cầu kỹ thuật cụ thể
- Hướng dẫn của BEREC ở Châu Âu khuyến nghị cho phép người dùng tự do lựa chọn router và MODEM
- Một số ISP cho phép người dùng sử dụng DOCSIS MODEM của riêng họ, nhưng cần chọn từ danh sách các nhà sản xuất được phê duyệt
- Việc sử dụng MODEM hoặc router của riêng bạn có thể yêu cầu người dùng tự giải quyết các vấn đề kỹ thuật
- Một số người cho rằng, hành vi của Starlink không khác biệt nhiều so với hành vi của các ISP khác, đều là để đảm bảo an toàn và ổn định cho mạng lưới
Sofie: open-source web based system for automating live TV news production #
https://nrkno.github.io/sofie-core/
Sofie TV Automation là một hệ thống tự động hóa truyền hình mã nguồn mở dựa trên web, phù hợp cho các chương trình phát sóng trực tiếp trong studio và ngoài hiện trường. Từ tháng 9 năm 2018, NRK, đài phát thanh công cộng của Na Uy, đã sử dụng hệ thống Sofie trong sản xuất tin tức truyền hình trực tiếp hàng ngày.
Hệ thống Sofie cung cấp hướng dẫn sử dụng chi tiết, giới thiệu các chức năng, cách cài đặt và vận hành của hệ thống. Đối với các nhà phát triển, Sofie cung cấp tài liệu cụ thể liên quan đến thông tin về phát triển hệ thống và đóng góp mã. Ngoài ra, hệ thống Sofie cũng công bố thông tin về các phiên bản hiện tại, trước đây và sắp ra mắt.
Cộng đồng Sofie hoan nghênh tất cả người dùng và nhà phát triển tham gia cộng đồng Slack của họ để trao đổi và thảo luận về các chủ đề liên quan đến hệ thống Sofie. Bản quyền của hệ thống Sofie thuộc về Công ty Phát thanh Na Uy và những người đóng góp. Nói chung, Sofie TV Automation là một hệ thống tự động hóa truyền hình mã nguồn mở mạnh mẽ, có thể giúp các đài truyền hình và nhà sản xuất chương trình phát sóng trực tiếp nâng cao hiệu quả và chất lượng.
HN | Nóng: 260 điểm | 35 bình luận | Tác giả: rjmunro | 11 giờ trước #
https://news.ycombinator.com/item?id=43936408
- Hệ thống mã nguồn mở Sofie có thể giúp các đài truyền hình tự động hóa việc sản xuất tin tức trực tiếp, nhưng hỗ trợ phần cứng của nó có thể là một vấn đề.
- Các đài truyền hình có thể cần phải xem xét đến khả năng tương thích với phần cứng hiện có và đầu tư vào phần cứng mới.
- Khả năng xử lý của máy tính đã đủ mạnh để thay thế một số phần cứng chuyên dụng, nhưng vẫn cần giải quyết vấn đề nhập và xử lý tín hiệu.
- Ngành công nghiệp đang chuyển đổi sang giao thức 2110 và mạng spine và leaf, Sofie có thể hỗ trợ các công nghệ mới này.
- Sự đơn giản và chủ nghĩa tối giản có thể trở thành một lợi thế, bản chất mã nguồn mở của Sofie có thể thu hút nhiều người dùng hơn.
- Môi trường làm việc và yêu cầu của các đài truyền hình có thể ảnh hưởng đến việc áp dụng và sử dụng Sofie.
21 GB/s CSV Parsing Using SIMD on AMD 9950X #
https://nietras.com/2025/05/09/sep-0-10-0/
Bài viết này giới thiệu về quá trình tối ưu hóa hiệu năng của một trình phân tích cú pháp CSV .NET có tên là Sep. Tác giả giới thiệu phiên bản mới nhất của Sep, 0.10.0, phiên bản này đã đạt được tốc độ phân tích cú pháp CSV là 21 GB/s trên bộ xử lý AMD 9950X, gấp 3 lần so với các phiên bản trước. Tác giả cũng cung cấp một bảng tiến trình hiệu năng, cho thấy sự cải thiện hiệu năng của Sep từ phiên bản 0.1.0 đến phiên bản 0.10.0.
Tác giả chỉ ra rằng, sự cải thiện hiệu năng của Sep không chỉ nhờ vào việc tối ưu hóa mã, mà còn nhờ vào các phiên bản mới của .NET framework và bộ xử lý nhanh hơn. Tác giả cũng đề cập rằng Sep hỗ trợ tập lệnh AVX-512, nhưng việc tạo mã của .NET 8 có một số vấn đề, dẫn đến hiệu năng kém. Để giải quyết vấn đề này, tác giả đã triển khai một trình phân tích cú pháp AVX-512-to-256 mới, trình phân tích cú pháp này có thể bỏ qua những vấn đề này và đạt được hiệu năng tốt hơn.
Bài viết cũng so sánh hiệu năng của trình phân tích cú pháp AVX-512 và AVX2, kết quả cho thấy trình phân tích cú pháp AVX2 thực tế nhanh hơn trong một số trường hợp. Tác giả đã phân tích mã và mã hợp ngữ, và phát hiện ra rằng việc tạo mã của .NET có một số vấn đề, dẫn đến hiệu năng kém của trình phân tích cú pháp AVX-512. Để giải quyết vấn đề này, tác giả đã triển khai một trình phân tích cú pháp AVX-512-to-256 mới, trình phân tích cú pháp này có thể bỏ qua những vấn đề này và đạt được hiệu năng tốt hơn.
Cuối cùng, tác giả tóm tắt quá trình tối ưu hóa hiệu năng của Sep, chỉ ra rằng sự cải thiện hiệu năng của Sep là kết quả của sự kết hợp giữa tối ưu hóa mã, .NET framework mới và bộ xử lý nhanh hơn. Tác giả cũng chỉ ra rằng, quá trình tối ưu hóa hiệu năng của Sep là một quá trình liên tục, và sẽ có nhiều tối ưu hóa và cải tiến hơn nữa trong tương lai.
HN | Nóng: 240 điểm | 112 bình luận | Tác giả: zigzag312 | 11 giờ trước #
https://news.ycombinator.com/item?id=43936592
- Intel đã từ bỏ AVX-512 trong CPU cấp tiêu dùng, mặc dù trước đây họ đã quảng bá mạnh mẽ công nghệ này
- Intel có xu hướng quảng bá mạnh mẽ một công nghệ mới, nhưng sẽ từ bỏ nó nếu không thấy đủ sự chấp nhận
- Công nghệ Optane của Intel được coi là rất hứa hẹn, nhưng họ đã đột ngột từ bỏ nó
- Bộ xử lý Itanium của Intel được coi là một ví dụ thất bại, mặc dù họ đã đầu tư rất nhiều nguồn lực
- Kiến trúc VLIW được coi là không phù hợp cho các hệ thống đa nhiệm và đa người dùng
- Chiến lược phân khúc thị trường của Intel được coi là cản trở việc áp dụng các công nghệ mới
- Việc giới hạn các tính năng cao cấp chỉ cho các sản phẩm cao cấp dẫn đến việc các nhà phát triển phần mềm thiếu động lực để áp dụng các tính năng này
- Quyết định của Intel có thể là do cân nhắc về mặt thương mại, nhưng điều này có thể dẫn đến việc các công nghệ của họ bị chôn vùi