2025-07-13 Top Stories #

OpenAI từ bỏ việc mua lại công ty khởi nghiệp về lập trình AI Windsurf, CEO và đồng sáng lập của Windsurf sẽ gia nhập nhóm DeepMind của Google.
Các tác phẩm nghệ thuật được tạo ra bằng MacPaint vào giữa những năm 80 vẫn có giá trị nghệ thuật cho đến ngày nay, thể hiện sự quyến rũ của nghệ thuật kỹ thuật số thời kỳ đầu.
ETH Zurich và EPFL sẽ đào tạo một mô hình ngôn ngữ lớn đa ngôn ngữ mở tại Trung tâm Siêu máy tính Thụy Sĩ và phát hành mã nguồn mở vào cuối mùa hè năm 2025.
Tác giả giải quyết vấn đề thu thập dữ liệu của trình thu thập thông tin web bằng cách tạo các tệp JPEG giả, giảm tải máy chủ và tối ưu hóa dữ liệu được tạo.
Báo cáo sơ bộ về vụ tai nạn máy bay của hãng hàng không Ấn Độ cho thấy công tắc nhiên liệu đã bị tắt trước khi vụ tai nạn xảy ra, phi công đã nhầm lẫn trong thao tác, cuộc điều tra vẫn đang được tiến hành.
Ngân sách NOAA năm 2026 đề xuất hủy bỏ dự án TraCSS để ngăn chặn va chạm vệ tinh, có thể dẫn đến sự thụt lùi hàng thập kỷ của Hoa Kỳ trong quản lý giao thông không gian.
Ngôn ngữ Jank đạt được khả năng tương tác liền mạch với C++, trình bày chi tiết về quản lý bộ nhớ, xử lý kiểu và các ví dụ ứng dụng thực tế.
Trang web thử nghiệm “wtf” giúp người dùng đánh giá mức độ nắm vững lớp JavaScript Date thông qua 20 câu hỏi, kết quả có thể chia sẻ.
OpenAI trì hoãn việc phát hành mô hình trọng số mở để tiến hành kiểm tra an toàn bổ sung và xem xét các lĩnh vực rủi ro cao, đảm bảo xử lý đúng các thách thức.
Phần mềm độc hại được tìm thấy trong plugin chính thức của Gravity Forms, cho thấy chuỗi cung ứng đã bị xâm phạm, chỉ các plugin được cài đặt thông qua trang web chính thức hoặc Composer mới bị ảnh hưởng.

Thỏa thuận Windsurf của OpenAI đã kết thúc, và CEO của Windsurf sẽ đến Google #

OpenAI’s Windsurf deal is off, and Windsurf’s CEO is going to Google

https://www.theverge.com/openai/705999/google-windsurf-ceo-openai

Thương vụ OpenAI dự kiến mua lại công ty khởi nghiệp lập trình AI Windsurf đã đổ vỡ. Thay vào đó, Google sẽ thuê Giám đốc điều hành của Windsurf, Varun Mohan, đồng sáng lập Douglas Chen và một số nhân viên R&D của Windsurf gia nhập nhóm Google DeepMind. Thông tin này được Google và Windsurf cùng công bố vào thứ Sáu. Mohan và các nhân viên của Windsurf sẽ tập trung vào công việc lập trình đại diện tại Google DeepMind và chủ yếu làm việc cho dự án Gemini. Google sẽ không có bất kỳ quyền kiểm soát hoặc cổ phần nào đối với Windsurf, nhưng sẽ nhận được giấy phép không độc quyền đối với một phần công nghệ của Windsurf.

Giám đốc kinh doanh của Windsurf, Jeff Wang, ngay lập tức trở thành Giám đốc điều hành tạm thời, Phó chủ tịch bán hàng toàn cầu Graham Moreno sẽ trở thành Chủ tịch mới của Windsurf. Người phát ngôn của Google, Chris Pappas, nói với The Verge trong một tuyên bố: “Gemini là một trong những mô hình tốt nhất trên thị trường và chúng tôi liên tục đầu tư vào các tính năng nâng cao mà nó cung cấp cho các nhà phát triển. Chúng tôi rất vui mừng được chào đón một số nhân tài lập trình AI hàng đầu từ nhóm Windsurf gia nhập Google DeepMind để thúc đẩy công việc của chúng tôi trong lĩnh vực lập trình đại diện.” Mohan và Chen cho biết trong một tuyên bố: “Chúng tôi rất vui mừng được gia nhập Google DeepMind cùng với một phần của nhóm Windsurf. Chúng tôi tự hào về những thành tựu mà Windsurf đã đạt được trong bốn năm qua và rất hào hứng khi bắt đầu giai đoạn tiếp theo với một đội ngũ đẳng cấp thế giới.”

Google không tiết lộ chi phí cụ thể để thuê nhóm này. Trước đó đã có báo cáo rằng OpenAI có kế hoạch mua lại Windsurf với giá 3 tỷ đô la.

HN | Độ nóng: 948 điểm | 610 bình luận | Tác giả: rcchen #

https://news.ycombinator.com/item?id=44536988

Ngoài các vấn đề về sở hữu trí tuệ của Microsoft, sự phổ biến của Claude Code khiến việc fork IDE trở nên lãng phí, vì có rất nhiều công cụ CLI mã nguồn mở miễn phí.
Chi phí phát triển một agent CLI trên terminal thấp hơn nhiều so với việc fork toàn bộ IDE.
Claude Code dễ sử dụng, có thể dùng với bất kỳ IDE nào, chỉ cần một vài mở rộng đơn giản để cải thiện trải nghiệm người dùng.
Anthropic có thể tự do giảm tỷ suất lợi nhuận API để đổi lấy doanh thu đăng ký có thể dự đoán hơn và quyền truy cập dữ liệu huấn luyện.
Cursor/Windsurf so với VS Code + CC có lợi thế ở mô hình tự động hoàn thành thẻ và một số chi tiết UI.
Cho rằng đây là điềm báo cho sự phát triển trong tương lai, Cursor có thể là công ty nhanh nhất đạt được 9 triệu đô la ARR, cũng có thể là công ty giảm nhanh nhất.
Giá trị của Cursor như một IDE có thể là ngắn ngủi, chủ yếu là để chống lại tham vọng thị trường của Microsoft.
Agent nhận được nhiều giá trị thông qua giao thức ngữ cảnh mô hình, và danh sách khách hàng hỗ trợ đầy đủ giao thức này rất ngắn, nhưng cửa sổ VSCode Chat là một trong số đó.
Cho rằng việc tích hợp agent vào IDE sẽ mang lại nhiều giá trị hơn, nhưng không muốn bị buộc phải sử dụng CoPilot/OpenAI.
Agent có thể truy cập nhiều công cụ ngữ cảnh hơn do được tích hợp vào trình soạn thảo, chẳng hạn như các lỗi linting được tập trung và các lỗi kiểm thử.
Anthropic có thể cung cấp CC với mức lỗ lên đến 500%, đồng thời hạn chế quyền truy cập sonnet/opus 4 vào Windsurf và tăng giá chào doanh nghiệp cho Cursor.
Cursor và các UX wrapper khác chỉ có khả năng chiến thắng nếu các mô hình trên thiết bị hoặc ít nhất là các mô hình mã nguồn mở bắt kịp trong hai năm tới.
Cho rằng Cursor và các UX wrapper khác muốn thắng, thì mô hình phải là hàng hóa thực sự.
Cho rằng Anthropic có tỷ suất lợi nhuận lớn trên API và họ bán Claude Code với giá thấp hơn tỷ suất lợi nhuận đó.
Có tỷ suất lợi nhuận đáng kể trên giá Claude API, cho rằng Anthropic thu được tỷ suất lợi nhuận 80% trên API của họ.
Cho rằng sonnet/opus tốt hơn deepseek rất nhiều, không thể so sánh được.
Cho rằng deepseek là mô hình deepseek được chắt lọc.
Cho rằng Claude có thể làm những điều điên rồ với seed ngẫu nhiên phù hợp.
Cho rằng Claude thường có cảm giác như một kẻ ngốc vụng về, nhưng trong một số ít trường hợp lại có cảm giác như một siêu trí tuệ có tri giác.
Cho rằng Claude Code có cảm giác rất đắt, nhưng không có nhiều góc nhìn để so sánh.
Cho rằng các gói Claude Code Max 100 & 200 rất hợp lý, so với các dịch vụ tính phí theo token sử dụng khác.
Cho rằng việc sử dụng CC hàng ngày thường là 50-100 đô la mỗi ngày, gói Max là giá trị tuyệt đối xứng đáng.
Cho rằng việc sử dụng tín dụng API của Opus rất dễ đạt 100 đô la mỗi giờ, các nhà cung cấp mô hình và trung tâm dữ liệu đều được trợ cấp rất nhiều.
Cho rằng các công cụ AI trên quy mô lớn sẽ cực kỳ tốn kém, cần phải phù hợp với cách làm của đối thủ cạnh tranh.
Lo ngại rằng các nhà phát triển độc lập trở nên phụ thuộc vào mô hình, 100-200 đô la là quà tặng chi phí thu hút khách hàng.
Cho rằng các nhà phát triển chuyên nghiệp sẽ cần ngân sách tính toán suy luận lớn.
Cho rằng những mô hình tốt này sẽ chạy trên thiết bị trong tương lai, chỉ tốn chi phí phần cứng.

Nghệ thuật MacPaint từ giữa những năm 80 vẫn trông tuyệt vời đến ngày nay #

MacPaint Art from the Mid-80s Still Looks Great Today

https://blog.decryption.net.au/posts/macpaint.html

Bài viết này được đăng vào ngày 12 tháng 7 năm 2025, tác giả chia sẻ sự ngưỡng mộ của mình đối với những tác phẩm nghệ thuật ban đầu được tạo ra bằng MacPaint vào giữa những năm 80 mà anh đã tìm thấy khi duyệt CD-ROM của BMUG. Anh tiếp tục duyệt hơn 18.000 hình ảnh MacPaint trên Discmaster để tìm kiếm những tác phẩm hay hơn. Trong bài viết, tác giả trưng bày một số tác phẩm ấn tượng mà anh đã tìm thấy và đưa ra ý tưởng thử tìm kiếm những nghệ sĩ này, tìm hiểu xem họ đang làm gì. Tác giả cho rằng, nếu những nghệ sĩ này có thể tạo ra những tác phẩm như vậy trên thiết bị 9 inch, 1 bit cách đây 40 năm, thì có lẽ họ đã đạt được nhiều thành tựu hơn nữa.

Bài viết cũng đề cập đến máy tính Amiga, một loại máy tính gia đình khác cùng thời với MacPaint, có khả năng tạo ra những tác phẩm nghệ thuật máy tính tương tự (hoặc thậm chí tốt hơn). Tác giả dự định sẽ khám phá lĩnh vực này trong thời gian ngắn tới để tìm kiếm thêm những tác phẩm thú vị.

Tác giả cũng chia sẻ một số tác phẩm nghệ thuật mà anh cho là ít nổi bật hơn, những tác phẩm này tuy không được thiết kế đặc biệt để trở thành nghệ thuật, nhưng vẫn là những logo, đồ họa, biểu tượng, v.v. rất thú vị. Anh khuyến khích độc giả truy cập trang web Discmaster, sử dụng chức năng tìm kiếm theo loại tệp để tìm hình ảnh, MacPaint, MacDraw hoặc các chương trình đồ họa cũ khác (thậm chí có thể là các tệp Photoshop trước năm 1990) sẽ có thể tìm thấy hàng ngàn tác phẩm theo phong cách này.

Cuối bài viết, tác giả trưng bày một số biểu tượng nhỏ mà anh yêu thích và tổng hợp chúng vào một khung vẽ duy nhất. Đối với những người muốn sáng tạo nghệ thuật tương tự, tác giả giới thiệu một cuốn sách có tên “Zen & The Art of The Macintosh”, cuốn sách này có thể tìm thấy trên Internet Archive, mô tả chi tiết về công nghệ vào thời điểm đó. Tác giả cho rằng cuốn sách này xứng đáng có một bài viết riêng, vì vậy anh không tiết lộ quá nhiều chi tiết trong bài viết này. Bài viết kết thúc bằng dòng chữ “More Posts | RSS | decryption???” có thể là liên kết hoặc gợi ý đến nhiều nội dung liên quan hơn.

HN | Độ nóng: 736 điểm | 166 bình luận | Tác giả: decryption #

https://news.ycombinator.com/item?id=44540402

Một số tác phẩm nghệ thuật có tính toàn vẹn về mặt thẩm mỹ đến mức chúng không được tăng cường về mặt nghệ thuật sau khi phần cứng đồ họa hoặc khả năng được cải thiện.
Cách diễn đạt của con người bị ảnh hưởng bởi các công cụ, ví dụ như âm nhạc của Bach bị ảnh hưởng bởi đặc tính không duy trì âm thanh của đàn clavichord.
Không phải tất cả các tác phẩm nghệ thuật đều bị ảnh hưởng bởi các công cụ, ví dụ như một số trò chơi Wii trông đẹp hơn ở độ phân giải cao.
Phông chữ Chicago phiên bản pixel trông tuyệt vời, nhưng phiên bản vector thì không.
Album Switched-on Bach xuất sắc vì âm trầm tổng hợp rõ ràng và dễ nhận biết hơn so với nhạc cụ acoustic.
Các tác phẩm của Wendy Carlos nổi bật vì sự trung thành và gu thẩm mỹ của cô ấy đối với bản gốc.
Wendy Carlos năm nay 85 tuổi và đã không phát hành CD hoặc cấp phép phát nhạc trực tuyến trong hai mươi năm qua.
Nhạc cổ điển phương Tây có truyền thống sử dụng những tiến bộ công nghệ tiên tiến, đặc biệt là trong luyện kim và kỹ thuật chế biến gỗ cao cấp.
Nhạc cổ điển có xu hướng ổn định sau khi công nghệ ghi âm và khuếch đại điện âm xuất hiện.
Nhạc cổ điển là loại nhạc phổ biến trong hơn hai thế hệ.
Nhạc cổ điển đã mất đi thính giả đối với những âm thanh mới lạ.
Không thể có một loại hình thực hành âm nhạc nào mãi mãi ở vị trí tiên phong của thử nghiệm.
Các nhạc sĩ cổ điển vĩ đại là những ngôi sao nhạc rock của thời đại họ.
Nhạc cổ điển là nhạc dân tộc truyền thống tinh hoa của Đức-Pháp, không nên bị đánh giá tiêu cực vì sự cố định của nó.
Nhạc cổ điển đã truyền ngọn đuốc thử nghiệm của mình cho các thế hệ sau, nhạc rock và jazz cũng đã ổn định.

ETH Zurich và EPFL sẽ phát hành một LLM được phát triển trên cơ sở hạ tầng công cộng #

ETH Zurich and EPFL to release a LLM developed on public infrastructure

https://ethz.ch/en/news-and-events/eth-news/news/2025/07/a-language-model-built-for-the-public-good.html

ETH Zurich và EPFL sẽ phát hành một mô hình ngôn ngữ lớn (LLM) được phát triển trên cơ sở hạ tầng công cộng. LLM mới này được huấn luyện trên siêu máy tính “Alps” của Trung tâm Siêu máy tính Quốc gia Thụy Sĩ (CSCS), đánh dấu một cột mốc quan trọng đối với AI nguồn mở và sự xuất sắc đa ngôn ngữ.

Ngày 9 tháng 7 năm 2025, được viết bởi Florian Meyer (Truyền thông Doanh nghiệp) và Mélissa Anchisi (Trưởng bộ phận Truyền thông AI của EPFL).

Vào cuối mùa hè năm 2025, một mô hình ngôn ngữ lớn (LLM) công cộng do các nhà nghiên cứu từ EPFL, ETH Zurich và Trung tâm Siêu máy tính Quốc gia Thụy Sĩ (CSCS) cùng phát triển sẽ được phát hành. LLM này sẽ hoàn toàn mở, được thiết kế để hỗ trợ một loạt các ứng dụng và thúc đẩy sự đổi mới trong khoa học, xã hội và công nghiệp. Một đặc điểm của mô hình là khả năng thông thạo đa ngôn ngữ trên hơn 1000 ngôn ngữ.

Đầu tuần này, tại Geneva, khoảng 50 sáng kiến và tổ chức LLM nguồn mở và AI đáng tin cậy hàng đầu thế giới đã tập trung tại Hội nghị thượng đỉnh quốc tế về xây dựng LLM nguồn mở. Sự kiện này do Trung tâm AI của EPFL và ETH Zurich tổ chức, đánh dấu một bước quan trọng trong việc xây dựng một hệ sinh thái quốc tế năng động và hợp tác cho các mô hình nền tảng mở. LLM nguồn mở ngày càng được coi là một giải pháp thay thế đáng tin cậy cho các hệ thống thương mại, hầu hết được phát triển kín đáo ở Hoa Kỳ hoặc Trung Quốc.

Những người tham gia hội nghị thượng đỉnh đã xem trước một LLM được phát triển công khai, hoàn toàn mở sắp được phát hành - được đồng sáng tạo bởi các nhà nghiên cứu từ EPFL, ETH Zurich và các trường đại học Thụy Sĩ khác hợp tác chặt chẽ với các kỹ sư của CSCS. Hiện tại, mô hình đang được thử nghiệm cuối cùng và sẽ có thể tải xuống theo giấy phép mở. Tính chất mở của mô hình có nghĩa là bất kỳ ai cũng có thể truy cập, sử dụng, sửa đổi và phân phối nó, điều này giúp thúc đẩy sự đổi mới và cạnh tranh công bằng.

HN | Độ nóng: 647 điểm | 90 bình luận | Tác giả: andy99 #

https://news.ycombinator.com/item?id=44535637

ETH và EPFL đang huấn luyện hoặc tinh chỉnh một mô hình LLaMA cũ, hiệu suất có thể không bằng công nghệ mới nhất.
ETH và EPFL thiếu kinh nghiệm huấn luyện quy mô lớn, nhưng sở hữu nguồn lực trí tuệ mạnh mẽ.
Luật pháp của Thụy Sĩ và EU cho phép sử dụng dữ liệu có bản quyền để huấn luyện với điều kiện tôn trọng bản quyền và cơ chế rút lui.
Dự án đang sử dụng kiến trúc do chính họ thiết kế, huấn luyện từ đầu, không liên quan đến Llama.
Dự án không sử dụng dữ liệu dbpedia, nguồn dữ liệu chính là fineweb2 đã được lọc.
Dự án giữ lại hơn 1800 cặp ngôn ngữ, bao gồm dữ liệu đã lọc chất lượng và chưa lọc.
Việc lọc chất lượng của tập dữ liệu có thể giúp khái quát hóa đa ngôn ngữ, nhưng hiệu quả cụ thể cần được nghiên cứu thêm.
Chất lượng của tập dữ liệu và dữ liệu tinh chỉnh như SFT là rất quan trọng đối với việc sử dụng thực tế của mô hình.
Huấn luyện mô hình từ đầu phức tạp hơn so với việc tinh chỉnh đơn giản.
Mô hình 70B tham số có thể khó bắt kịp SOTA, nhưng có thể là một lựa chọn tốt cho sử dụng cục bộ và mục đích thông thường.
Ngay cả khi tôn trọng cơ chế rút lui của trình thu thập dữ liệu web, do sự tồn tại của những tác nhân khác không tôn trọng cơ chế rút lui, tổn thất hiệu suất có thể không lớn.
Việc huấn luyện tôn trọng bản quyền và cơ chế rút lui không ảnh hưởng nhiều đến hiệu suất của mô hình.
Đã có một số tập dữ liệu văn bản web được xử lý đơn giản, chẳng hạn như Common Crawl, có thể được sử dụng để huấn luyện LLM.

Giả mạo một file JPEG #

Faking a JPEG

https://www.ty-penguin.org.uk/~auj/blog/2025/03/25/fake-jpeg/

Bài viết này được đăng vào ngày 25 tháng 3 năm 2025, với chủ đề “Faking a JPEG”, tức là cách nhanh chóng tạo ra các tệp JPEG trông có vẻ thật. Tác giả của bài viết đã thảo luận về một ứng dụng web nhỏ có tên là Spigot, chương trình này sử dụng chuỗi Markov để tạo động các cấu trúc phân cấp trang web giả, nhằm tạo ra nội dung vô nghĩa cho các trình thu thập dữ liệu web (web crawler) thu thập. Spigot đã hoạt động được vài tháng và cung cấp hơn một triệu trang nội dung mỗi ngày. Tác giả nhận thấy rằng, mặc dù đầu ra của Spigot không chứa hình ảnh, nhưng có một trình thu thập dữ liệu có tên là “ImageSiftBot” lại thường xuyên yêu cầu hình ảnh.

Mục tiêu chính của tác giả là để Spigot chạy mà không tiêu tốn quá nhiều CPU của máy chủ. Việc tạo hình ảnh là một hoạt động tốn nhiều CPU, đặc biệt là việc nén dữ liệu theo thời gian thực. Tác giả đã đưa ra một ý tưởng: nếu có một mẫu tệp JPEG chứa các phần “có cấu trúc” (như kích thước, độ sâu màu, v.v.) và các dấu hiệu chỉ vị trí của dữ liệu nén cao, thì có thể xây dựng các tệp trông giống JPEG bằng cách điền dữ liệu ngẫu nhiên vào khu vực “nén”. Đây là một hoạt động tiêu tốn ít CPU, người nhận sẽ thấy một tệp trông giống JPEG và cố gắng giải nén dữ liệu ngẫu nhiên.

Bài viết đề cập rằng, tệp JPEG bao gồm nhiều khối, mỗi khối có một dấu hiệu và độ dài. Tác giả đã quét 514 tệp JPEG trên trang web, giữ lại các khối “có cấu trúc” và ghi lại độ dài của các khối “dữ liệu pixel”, kết quả là tập dữ liệu nhỏ hơn 500KBytes. Bằng cách này, tác giả đã có được 514 mẫu thực với kích thước và độ sâu màu khác nhau.

Quá trình tạo JPEG được đơn giản hóa thành: chọn ngẫu nhiên một mẫu từ danh sách mẫu, đối với mỗi khối trong mẫu, nếu đó là khối dữ liệu pixel, thì xuất ra các byte ngẫu nhiên; nếu không, xuất ra dữ liệu của khối. Tác giả đã viết một số mã kiểm tra và thấy rằng tình hình thực tế không đơn giản như vậy. Dữ liệu pixel thực tế không hoàn toàn ngẫu nhiên mà được mã hóa Huffman và có một cấu trúc nhất định. Nếu điền dữ liệu hoàn toàn ngẫu nhiên vào khối pixel, bộ giải mã sẽ nhận thấy lỗi dữ liệu. Mặc dù vậy, tác giả nhận thấy rằng mọi trình xem JPEG đều chấp nhận dữ liệu rác của anh ta và hiển thị hình ảnh.

Tác giả cũng đề cập rằng, anh ta có thể tạo ra khoảng 900 hình ảnh như vậy mỗi giây trên máy chủ, với tốc độ khoảng 190MBytes/giây, nhanh hơn nhiều so với tốc độ kết nối Internet của máy chủ. Hiện tại, khoảng 60% các trang do Spigot tạo ra sẽ chứa một JPEG rác. Tác giả dự định sẽ phát hành mã lớp Python được sử dụng cho thao tác này vào một thời điểm thích hợp, mã này chưa đến 100 dòng (nhưng cần thêm chú thích).

Cuối cùng, sau khi xem xét mã hóa Huffman, tác giả đã thêm một mặt nạ bit vào dữ liệu pixel được tạo ra. Bằng cách thực hiện thao tác “AND” mỗi byte được tạo với 0x6D, đảm bảo rằng không có ba hoặc nhiều số 1 liên tiếp xuất hiện trong luồng bit, do đó làm giảm đáng kể xác suất tạo ra JPEG mã hóa Huffman không hợp lệ mà không tiêu tốn thêm CPU. Mục tiêu của tác giả là giảm chi phí tạo dữ liệu rác càng nhiều càng tốt, đồng thời tăng chi phí lạm dụng trình thu thập dữ liệu web. Mặc dù việc tạo ra một luồng Huffman hoàn toàn hợp lệ không khó, nhưng nó sẽ tiêu tốn nhiều CPU hơn và lợi ích thu được là rất ít.

HN | Độ nóng: 373 điểm | 87 bình luận | Tác giả: todsacerdoti #

https://news.ycombinator.com/item?id=44537631

Tệp robots.txt của trang web nên được cấu hình để ngăn trình thu thập thông tin truy cập vào cây spigot, nhưng Spigot vẫn có thể truy cập được sau khi xóa phần /spigot/.
Tác giả cho rằng không nên để chủ sở hữu trang web cấu hình robots.txt để ngăn chặn các cuộc tấn công DOS từ trình thu thập thông tin.
Trình thu thập thông tin nên nhận trang “429 Too Many Requests” khi yêu cầu quá nhiều, thay vì bị phạt trực tiếp.
Rất khó để thực hiện giới hạn yêu cầu trên mỗi IP đối với trình thu thập thông tin sử dụng botnet.
Nhà điều hành trang web không có nghĩa vụ phải “thân thiện” với những người thu thập thông tin trang web.
Các trình thu thập thông tin cung cấp dịch vụ công cộng như công cụ tìm kiếm Marginalia và archive.org không nên bị phạt.
Trang web có thể chọn cung cấp dữ liệu bình thường hoặc cung cấp dữ liệu giả ngẫu nhiên.
Không phải tất cả các trình thu thập thông tin web đều dùng để thu thập thông tin độc hại từ trang web.
Định nghĩa về trình thu thập thông tin web có thể dựa trên việc thu thập thông tin trang web, nhưng hành vi tốt hay xấu không thể do chủ sở hữu trang web đánh giá.
Tác giả có thể lo ngại rằng quá trình thu thập dữ liệu ngày càng tăng gây gánh nặng cho máy chủ, do đó chọn phạt tất cả các trình thu thập thông tin.
Có thể can thiệp vào trình thu thập thông tin đầu vào AI bằng cách thêm chú thích hình ảnh giả.
Một trình thu thập thông tin được viết tốt sẽ kiểm tra xem hình ảnh có khớp với chú thích hay không.
Chú thích đáng tin cậy nên là bán đáng tin cậy, chẳng hạn như “tác phẩm nghệ thuật số trừu tượng”.
Trình thu thập thông tin sẽ không kiểm tra độ tin cậy trên mọi trang, mà có thể lấy mẫu trang web.
Có quá nhiều nội dung rác trên Internet, có thể cần phải kiểm tra trên mọi trang.
Dự án Honeypot giúp xác định những người thu thập email.
Tập lệnh Honeypot đã lỗi thời và không thể sửa đổi theo ToS.
Bot chống bot bên ngoài của Facebook bỏ qua robots.txt một cách rõ ràng, được sử dụng để xác minh xem các liên kết có chứa phần mềm độc hại hay không.
Bot của Facebook có thể cung cấp dịch vụ DDoS miễn phí cho đối thủ cạnh tranh.
Đối với một số điểm cuối chuyên nghiệp, yêu cầu 10r/s có thể rất nặng.
Tùy thuộc vào nội dung được lưu trữ, yêu cầu 10r/s có thể gây áp lực cho một số trang web.

Báo cáo sơ bộ về vụ tai nạn của Air India được công bố #

Preliminary report into Air India crash released

https://www.bbc.co.uk/news/live/cx20p2x9093t

Trang chủ BBC đưa tin về vụ tai nạn máy bay Air India xảy ra vào ngày 12 tháng 6 năm 2025, khiến 260 người thiệt mạng. Báo cáo sơ bộ được công bố gần đây không đưa ra kết luận, nhưng phát hiện ra rằng công tắc nhiên liệu điều khiển động cơ đã ở trạng thái tắt ngay trước khi máy bay gặp nạn. Bản ghi âm giọng nói trong buồng lái cho thấy sự nhầm lẫn giữa hai phi công về cách tắt công tắc nhiên liệu. Một phi công hỏi người kia tại sao lại tắt công tắc, trong khi người kia trả lời rằng anh ta không làm như vậy.

Bộ trưởng Hàng không Ấn Độ kêu gọi mọi người không nên vội vàng đưa ra kết luận, và cơ quan quản lý hàng không Hoa Kỳ cho biết cuộc điều tra sẽ “bám sát sự thật”. Gia đình các nạn nhân bày tỏ nhiều nghi vấn hơn sau khi báo cáo sơ bộ được công bố, họ yêu cầu được giải đáp. Một người đàn ông nói với BBC rằng việc công bố báo cáo khiến anh cảm thấy có nhiều câu hỏi hơn là câu trả lời.

Cuộc điều tra do Cục Điều tra Tai nạn Máy bay Ấn Độ dẫn đầu, với sự hỗ trợ của Ủy ban An toàn Giao thông Quốc gia Hoa Kỳ. Báo cáo cuối cùng dự kiến sẽ được công bố vào năm tới. Hiện tại, bản tin trực tiếp của BBC đã kết thúc, nhưng công chúng có thể tiếp tục theo dõi những diễn biến mới nhất của vụ việc và tìm hiểu thêm về cách âm thanh buồng lái làm sâu sắc thêm bí ẩn về vụ tai nạn máy bay Air India.

Gia đình và bạn bè của các nạn nhân đã bày tỏ cảm xúc và yêu cầu của họ sau khi báo cáo sơ bộ được công bố. Ayushi Christian, người có chồng thiệt mạng trong vụ tai nạn, kêu gọi công lý cho các nạn nhân và yêu cầu hành động đối với những người chịu trách nhiệm. Lamnunthem Singson, người có anh họ, cho biết gia đình đang “cố gắng hiểu sự mất mát của chúng tôi” và không chắc chắn liệu việc biết nguyên nhân vụ tai nạn có thay đổi cách họ đau buồn hay không. Badasab Syed, người mất anh chị em và hai đứa con của họ, cho biết anh có nhiều câu hỏi hơn là câu trả lời sau khi báo cáo được công bố. Shweta Parihar, người mất chồng Abhinav Parihar, cho biết cô cảm thấy bất lực về cuộc điều tra đang diễn ra. Rafiq Dawood, người có con trai Faizan Rafiq thiệt mạng trong vụ tai nạn, cho biết họ không hiểu về công tắc nhiên liệu hoặc các chi tiết kỹ thuật khác, nhưng sự thật là họ đã mất con trai. Một người thân của Saiyed Javed Ali kêu gọi chính phủ Ấn Độ hành động đối với những người chịu trách nhiệm và yêu cầu một cuộc điều tra thích hợp để tìm ra nguyên nhân vụ tai nạn.

Luật sư hàng không đại diện cho gia đình các nạn nhân cho biết những phát hiện trong báo cáo sơ bộ về vụ tai nạn máy bay Air India là “rất đáng lo ngại”. Luật sư Demitrus Danas cho biết những phát hiện này “chắc chắn đáng được xem xét thêm để xác định thảm kịch này đã xảy ra như thế nào”. Ông nói thêm rằng họ sẽ tiếp tục nói chuyện và cung cấp lời khuyên cho các gia đình bị ảnh hưởng, đồng thời kêu gọi các gia đình không cảm thấy bị chủ sở hữu của Air India ép buộc ký các tài liệu liên quan đến việc thanh toán bồi thường tiềm năng.

Maithili Patil là một thành viên phi hành đoàn trên máy bay, cộng đồng quê hương của cô đã bày tỏ sự thương tiếc về sự ra đi của cô. Maithili là cô gái đầu tiên trong làng trở thành tiếp viên hàng không, và cả làng đều tự hào về cô. Công việc của cô cũng là một sự hỗ trợ lớn cho gia đình, và bây giờ gia đình phải tiếp tục sống trong đau buồn.

HN | Độ nóng: 362 điểm | 728 bình luận | Tác giả: cjr #

https://news.ycombinator.com/item?id=44536459

Chính sách của FAA khiến phi công phải lựa chọn giữa việc tìm kiếm điều trị sức khỏe tâm thần và sự nghiệp, có thể khuyến khích phi công che giấu các vấn đề về sức khỏe tâm thần.
Có người nghi ngờ đây là một vụ giết người tự sát, nhưng hiện tại chưa có bằng chứng xác thực.
Phi công khó có khả năng vô tình tắt công tắc nhiên liệu khi cất cánh, hành động này giống như cố ý hơn.
Khóa công tắc trên máy bay là cấu hình tiêu chuẩn, không phải là tùy chọn.
Phi công sẽ thực hiện các cuộc gọi và xác nhận trong quá trình vận hành, khó có khả năng chạm ngẫu nhiên vào các thiết bị điều khiển.
Tắt công tắc nhiên liệu của máy bay tương tự như tắt khóa điện xe hơi sau khi đỗ, khó có khả năng là hành động vô ý.
Các nút và thiết bị điều khiển trên máy bay thương mại nhiều hơn rất nhiều so với ô tô.
Cái gọi là “chập mạch não” không phải là một hiện tượng có thật.
Phi công nếu vì vấn đề sức khỏe tâm thần mà khóa cửa buồng lái và gây ra tai nạn máy bay, nên được coi trọng và thảo luận.
Ngành hàng không tồn tại vấn đề buộc phi công che giấu các vấn đề về sức khỏe tâm thần thay vì tìm kiếm điều trị.
Phi công nên được phép có ý nghĩ tự tử, giống như quân nhân, bác sĩ và người bình thường, thay vì bị coi là một vấn đề không thể chấp nhận được.
Thái độ của ngành hàng không đối với các vấn đề sức khỏe tâm thần là lạc hậu và cần phải thay đổi.

Đề xuất Ngân sách NOAA Loại bỏ Chương trình Được thiết kế để Ngăn chặn Va chạm Vệ tinh #

Proposed NOAA Budget Kills Program Designed to Prevent Satellite Collisions

https://skyandtelescope.org/astronomy-news/proposed-noaa-budget-kills-program-to-prevent-satellite-collisions/

Bài viết này thảo luận về kế hoạch ngân sách năm 2026 được đề xuất của Cơ quan Quản lý Khí quyển và Đại dương Quốc gia Hoa Kỳ (NOAA), kế hoạch này có thể hủy bỏ Hệ thống Điều phối Giao thông (TraCSS) được thiết kế để ngăn chặn va chạm vệ tinh. Bài viết bắt đầu bằng việc đề cập rằng chính quyền Trump đã ban hành một bản ghi nhớ về chính sách quản lý giao thông không gian quốc gia vào năm 2018, khi số lượng vệ tinh trên quỹ đạo toàn cầu chưa đến 5.000, trong khi hiện tại đã gần 12.000. Tuy nhiên, dự án quản lý giao thông do chính quyền Trump khởi xướng này hiện đang phải đối mặt với nguy cơ bị hủy bỏ.

Bài viết trích dẫn lời của Moriba Jah, một kỹ sư hàng không vũ trụ tại Đại học Texas ở Austin, người cho rằng đề xuất này “khiến Hoa Kỳ thụt lùi hàng thập kỷ” và gọi nó là “ngu ngốc”. Nhiệm vụ của TraCSS là cung cấp dữ liệu nhận thức tình huống không gian miễn phí cho các nhà khai thác vệ tinh dân sự và thương mại, bao gồm quỹ đạo và môi trường của các vật thể không gian trên quỹ đạo. Trước TraCSS, dữ liệu ngăn ngừa va chạm này do Bộ Quốc phòng (DOD) xử lý. Nhưng khi số lượng vệ tinh tăng lên, gánh nặng quản lý chúng trở nên quá xa rời trách nhiệm an ninh quốc gia cốt lõi của DOD.

Bài viết đề cập rằng TraCCS là một phiên bản thử nghiệm, được khởi động vào tháng 9 năm 2024 dưới Văn phòng Thương mại Không gian của NOAA, được thiết kế để trở thành một “cửa hàng một cửa”, cung cấp các dịch vụ có ý nghĩa, đáng tin cậy và có thể hành động để giúp đảm bảo an toàn, an ninh và tính bền vững của không gian. Tuy nhiên, cùng với kế hoạch của chính quyền Trump cắt giảm 2,2 tỷ đô la và 2.000 nhân viên của NOAA, TraCCS cũng bị ảnh hưởng, mặc dù nó chỉ tiêu tốn của chính phủ 55 triệu đô la mỗi năm, tương đương với chi phí của ba lần phóng tên lửa SpaceX.

Bài viết cũng đề cập rằng Audrey Schaffer, Phó Chủ tịch Chiến lược và Chính sách của Slingshot Aerospace, cho biết việc quản lý giao thông vệ tinh đã là một mục tiêu chính sách kể từ chính quyền Obama, vì vậy “tại sao chúng ta lại từ bỏ 10 năm tiến bộ… và vứt bỏ nó” là điều khó hiểu. Clayton Swope, Phó Giám đốc Chương trình An ninh Hàng không Vũ trụ tại Trung tâm Nghiên cứu Chiến lược và Quốc tế, cho biết, không giống như các công ty nhận thức tình huống không gian độc lập, chính phủ có thể thực thi một tiêu chuẩn dữ liệu theo dõi duy nhất. Ông so sánh nó với Cục Hàng không Liên bang; nếu không có nó, Hoa Kỳ có thể có “United Airlines đến một công ty để lấy thông tin kiểm soát không lưu, Delta Airlines đến một công ty khác và American Airlines đến một công ty khác, nhưng tất cả họ đều đang hạ cánh và hoạt động tại cùng một sân bay.” Điều này tạo ra không gian cho sự hỗn loạn và các vụ va chạm tiềm ẩn.

Bài viết cuối cùng chỉ ra rằng giải pháp thay thế cho TraCCS được đề xuất trong đề xuất ngân sách của NOAA là “khu vực tư nhân đã chứng minh rằng họ có năng lực và mô hình kinh doanh… để cung cấp các dịch vụ cơ bản miễn phí cho các nhà khai thác dân sự cũng như các dịch vụ cao cấp có tính phí.” Tuy nhiên, Swope giải thích rằng hiện tại không có quy tắc nào đảm bảo rằng các nhà khai thác vệ tinh sẽ mua dữ liệu theo dõi từ bất kỳ công ty tư nhân nào, thay vì sử dụng một lượng nhỏ thông tin miễn phí mà chính phủ vẫn sẽ công bố. Trong khi đó, châu Âu và Trung Quốc đang cung cấp các dịch vụ vệ tinh toàn diện, miễn phí của chính phủ.

HN | Độ nóng: 289 điểm | 168 bình luận | Tác giả: bikenaga #

https://news.ycombinator.com/item?id=44543150

Việc cắt giảm chi tiêu chính phủ là cần thiết, nhưng những dự án như thế này có giá trị rất cao và không nên bị coi là lãng phí.
Việc tư nhân hóa và giải thể liên bang nhanh chóng và liều lĩnh này sẽ dẫn đến sự phá hủy văn hóa và văn minh.
Nước Mỹ đang trải qua một cuộc “bán tháo” giống như nước Nga những năm 90, có thể dẫn đến tuổi thọ trung bình giảm đáng kể.
Liên minh châu Âu cũng đang trải qua điều tương tự, hóa đơn của chủ nghĩa tân tự do và toàn cầu hóa đã đến hạn.
Sự cai trị của Trump có thể dẫn đến việc nước Mỹ bước vào một kỷ nguyên đen tối hơn.
Chủ nghĩa tân tự do ở Nga đã dẫn đến chế độ tài phiệt độc đoán, phương Tây có thể có kết quả tương tự.
Nước Mỹ luôn là một quốc gia độc tài kinh tế mềm mỏng, nhưng nhiều người vẫn mong đợi một khế ước xã hội hiệu quả.
Trump đắc cử vì mọi người tức giận về sự biến mất của khế ước xã hội, và ông ta giả vờ coi trọng những bất mãn kinh tế của họ.
Tương lai của nước Mỹ có thể giống Hungary hơn, một liên minh mạnh mẽ được hình thành giữa chủ nghĩa phân biệt chủng tộc, chủ nghĩa dân tộc, chủ nghĩa chính thống tôn giáo và sự phủ nhận khoa học.
Thế hệ trẻ lớn lên trong môi trường này, chưa từng tiếp xúc với những thứ khác, và cho rằng những điều này là thật.
Sự phản kháng ở Mỹ chủ yếu tập trung vào việc phơi bày vấn đề, không có hành động tiếp theo thực tế.
Sự cai trị của Trump có thể dẫn đến việc nước Mỹ bước vào một kỷ nguyên đen tối hơn.
Đảng Dân chủ cũng không thực sự phản đối các chính sách của Trump, những nỗ lực của tòa án rất đáng khen ngợi, nhưng không có sự thống nhất xã hội hoặc chính trị thực sự để tấn công chu kỳ chính trị tiếp theo.
Sự cai trị của Trump có thể dẫn đến việc nước Mỹ bước vào một kỷ nguyên đen tối hơn.

Jank là C++ #

Jank is C++

https://jank-lang.org/blog/2025-07-11-jank-is-cpp/

Bài viết này nói về bài blog của Jeaye Wilkerson được đăng vào ngày 11 tháng 7 năm 2025, chủ đề là về cách anh ấy, với tư cách là một nhà phát triển độc lập, đã xây dựng những gì trong ba tháng để tương tác liền mạch giữa C++ và jank (một ngôn ngữ lập trình). Bài viết bắt đầu bằng cách cảm ơn các nhà tài trợ của quý này, bao gồm các nhà tài trợ cá nhân trên GitHub và Clojurists Together, đồng thời cảm ơn Vassil Vassilev và Lang Hames vì những đóng góp kỹ thuật của họ trong việc triển khai các tính năng này cho jank trong Clang và LLVM.

Bài viết được chia thành nhiều phần, đầu tiên giới thiệu về quản lý bộ nhớ. Trong tháng qua, tác giả đã triển khai việc quản lý bộ nhớ thủ công thông qua cpp/new và cpp/delete. Phương pháp quản lý này sử dụng bộ cấp phát GC của jank (hiện tại là bdwgc), do đó thường không cần sử dụng cpp/delete. Nhưng nếu sử dụng cpp/delete, việc thu gom bộ nhớ có thể chủ động và xác định hơn. Việc triển khai cũng bao gồm hỗ trợ bdwgc đầy đủ cho các hàm hủy, vì vậy dù xóa thủ công hay thu gom tự động đều sẽ kích hoạt các hàm hủy không tầm thường.

Tiếp theo, bài viết thảo luận về việc sử dụng giá trị đúng và sai. Để tránh bất kỳ chuyển đổi ngầm định nào của đối tượng jank, giờ đây bạn có thể sử dụng cpp/true và cpp/false, chúng là các giá trị boolean C++ trực tiếp. Điều này rất hữu ích khi cố gắng giữ cho IR (biểu diễn trung gian) được tạo ra càng tinh gọn càng tốt, so với việc sử dụng true hoặc false và để jank tự động chuyển đổi từ Clojure sang C++. Trong tương lai, jank sẽ bổ sung hỗ trợ cho macro trình đọc #cpp, như một cách dễ dàng để lấy các literal C++, tương tự như #js trong ClojureScript và #dart trong ClojureDart.

Bài viết cũng đề cập đến việc biểu diễn các chuỗi kiểu phức tạp. Giờ đây, bạn có thể biểu diễn nhiều loại có thể có bằng cú pháp Clojure thông thường. Tháng này, tác giả cũng đã mở rộng điều này để bao gồm các kiểu con trỏ trong các ký hiệu. Ví dụ: cpp/int** sẽ cung cấp cho bạn một kiểu C++ int**. Tuy nhiên, khi cần khoảng trắng hoặc dấu phẩy, chẳng hạn như trong các template, các ký hiệu của Clojure trở nên quá hạn chế. Trong những trường hợp này, giờ đây bạn có thể sử dụng (cpp/type "std::map<std::string, int>"). Điều này sẽ được đánh giá là một kiểu và có thể được sử dụng trong các vị trí kiểu trong cpp/cast, cpp/new, v.v.

Bài viết tiếp tục thảo luận về hàm tạo kiểu phức tạp. Với sự ra đời của cú pháp kiểu phức tạp mới, một vấn đề đã nảy sinh. Clojure sử dụng hậu tố . để biểu thị các lệnh gọi hàm tạo, nhưng chúng ta không muốn bao gồm hậu tố . trong chuỗi cpp/type, vì đó không phải là cú pháp C++ hợp lệ. Để giải quyết vấn đề này, jank hiện coi hậu tố . trên kiểu là tùy chọn. Nếu bạn gọi một kiểu, nó được coi là một lệnh gọi hàm tạo. Về điểm này, bài viết đề cập rằng ClojureDart là ngôn ngữ đầu tiên làm như vậy.

Bài viết cũng giới thiệu khái niệm về hộp không trong suốt (opaque box). Trong JVM, mọi lớp đều kế thừa ngầm định từ Object, điều này cho phép cấu trúc dữ liệu của Clojure chỉ lưu trữ Object mà không cần lo lắng về tất cả các kiểu có thể được sử dụng. Tuy nhiên, trong môi trường native, mỗi kiểu mặc định là độc lập. Ngay cả khi bạn có kiểu đối tượng cơ sở trong mã của riêng mình, các dependency của bạn sẽ không sử dụng nó. Cách duy nhất để tham chiếu bất kỳ kiểu nào sẽ là void*. Khi chúng ta làm điều này, thông tin kiểu về dữ liệu sẽ bị mất. Nhà phát triển cần thêm thông tin kiểu đó trở lại một cách chính xác sau này, bằng cách chuyển đổi void* trở lại các con trỏ khác. Tháng này, tác giả đã xây dựng một cấu trúc có tên là hộp không trong suốt. Ý tưởng là bạn có thể đóng gói bất kỳ con trỏ native thô nào vào một đối tượng jank, bằng cách sử dụng cpp/box. Từ đó, đối tượng có thể được sử dụng với cấu trúc dữ liệu của jank, được truyền, so sánh (theo giá trị con trỏ), v.v. Khi bạn muốn lấy nó ra, có một dạng cpp/unbox đặc biệt có thể làm điều đó, đồng thời chỉ định kiểu dữ liệu.

Bài viết cũng đề cập đến các tệp tiêu đề được biên dịch trước (PCH). Khả năng tương tác C++ liền mạch với thời gian chạy jank yêu cầu Clang xử lý ngay lập tức các tệp tiêu đề C++ của jank. Điều này tốn kém và có thể ảnh hưởng đến thời gian khởi động, vì vậy tác giả đã thiết lập việc biên dịch trước các tệp tiêu đề này. Điều này cần được thực hiện trên mọi máy, vì vậy jank sẽ hoàn thành nó sau khi cài đặt, khi bạn chạy jank lần đầu tiên. Khi jank được cập nhật, nó sẽ tự động biên dịch lại PCH.

Bài viết cũng thảo luận về tính ổn định. Rất nhiều công sức đã được đầu tư vào việc tìm cách phá vỡ khả năng tương tác liền mạch của jank. C++ là một ngôn ngữ rất lớn, tác giả có hàng trăm bài kiểm tra tương tác. Trong tháng qua, tác giả đã phát hiện ra nhiều sự cố khác nhau liên quan đến các vấn đề với mảng, con trỏ toàn cục, tham chiếu tĩnh, con trỏ hàm, lệnh gọi hàm C có thể thay đổi và PCH, tối ưu hóa IR liên quan đến Clang và LLVM, v.v. Đây là một nỗ lực liên tục, ở tuyến đầu của công nghệ tương tác và bộ thử nghiệm jank, tác giả xây dựng sự tự tin thông qua bộ thử nghiệm để đảm bảo hệ thống hoạt động tốt.

Bài viết cũng đề cập đến kiểu tĩnh. Đối với bất kỳ ai chưa cân nhắc vấn đề này, mọi phần của khả năng tương tác liền mạch của jank đều là kiểu tĩnh. Nó là C++. Không có reflection thời gian chạy, không có phỏng đoán và không có gợi ý. Nếu trình biên dịch không thể tìm thấy thành viên, hàm hoặc quá tải cụ thể, bạn sẽ nhận được lỗi trình biên dịch. Tác giả tin rằng đây là một cách thú vị để bắt đầu suy nghĩ về jank, Clojure và kiểu tĩnh. Nó cũng mở đường cho việc bắt đầu mở rộng thông tin kiểu sang các phần khác của chương trình jank.

Trước khi trình bày một số ví dụ thực tế về việc jank thực hiện các tác vụ C++, tác giả yêu cầu người đọc cân nhắc đăng ký danh sách gửi thư của jank. Đây sẽ là cách tốt nhất để đảm bảo bạn theo kịp các bản phát hành jank, các bài giảng liên quan đến jank, hội thảo, v.v.

Bài viết kết thúc bằng cách cung cấp một số ví dụ thực tế, cho thấy jank thực hiện các thao tác C++ như thế nào. Đầu tiên là một ví dụ về việc xuất “Hello world” thông qua luồng, sau đó là một ví dụ về trình in JSON đẹp mắt sử dụng thư viện của bên thứ ba JSON for Modern C++, và cuối cùng là một ví dụ về một chương trình sử dụng ftxui để xuất ra terminal bằng cách sử dụng bố cục flexbox. Các ví dụ này cho thấy cách đan xen giữa Clojure và C++, và mọi thứ đều hoạt động tốt.

HN | Độ nóng: 277 điểm | 96 bình luận | Tác giả: Jeaye #

https://news.ycombinator.com/item?id=44534787

Ngôn ngữ Jank giải quyết vấn đề bằng cách nhúng LLVM vào thời gian chạy, nhưng mọi người hy vọng có những cách tốt hơn để xử lý Dynamic FFI và vấn đề name mangling.
C++ thiếu tiêu chuẩn cho name mangling, cũng như các phương pháp để thực hiện name mangling hoặc demangling tại thời điểm biên dịch.
Mọi người kỳ vọng C++26 sẽ mang lại constexpr dynamic allocation và tiêu chuẩn compile-time reflection.
Carmack đã đạt được chức năng tương tự trong engine Trinity/Quake3 bằng cách biên dịch mã C và dịch nó thành máy stack của riêng mình.
Carmack được coi là kỹ sư 10x, công việc của ông có ảnh hưởng sâu rộng.
Carmack và Romero có thể nhớ những thách thức kỹ thuật mà họ đã giải quyết.
Tóm tắt và ghi lại tài liệu sau khi giải quyết vấn đề có thể giúp ghi nhớ các chi tiết kỹ thuật.
Carmack luôn theo đuổi sự xuất sắc và không ngừng tiến bộ.
Mọi người có xu hướng nhớ những điều khiến họ cảm thấy thất vọng nhưng cuối cùng đã vượt qua được.
Từ “grindset” được yêu thích.
Liên kết trực tiếp đến C++ trở nên rất khó khăn vì vấn đề symbol mangling.
Không có C ABI thống nhất, các trình biên dịch trên các hệ điều hành khác nhau xử lý khác nhau.
Hệ thống Unix tuân theo System V ABI, trong khi Windows có ABI riêng.

New Date(“wtf”) – Bạn hiểu về lớp Date của JavaScript đến mức nào? #

New Date(“wtf”) – How well do you know JavaScript’s Date class?

https://jsdate.wtf

Trang web này là một bài kiểm tra nhỏ về lớp Date của JavaScript. Nó được tạo ra bởi samwho, với rất nhiều tâm huyết. Trang web cung cấp một bài kiểm tra gồm 20 câu hỏi về lớp Date của JavaScript, người dùng có thể kiểm tra mức độ hiểu biết của mình về lớp Date của JavaScript tại đây. Trang kiểm tra cung cấp một giao diện đơn giản, người dùng có thể trả lời các câu hỏi từng câu một và có thể xem điểm số của mình. Sau khi kiểm tra xong, người dùng có thể chọn chia sẻ hoặc sao chép kết quả kiểm tra. Toàn bộ quá trình kiểm tra được thực hiện trên trình duyệt của người dùng, không cần sự tham gia của máy chủ, điều này làm cho quá trình kiểm tra nhanh chóng và thuận tiện. Thiết kế của trang web đơn giản và rõ ràng, nhằm giúp người dùng hiểu và nắm vững lớp Date của JavaScript tốt hơn.

HN | Độ nóng: 273 điểm | 157 bình luận | Tác giả: OuterVale #

https://news.ycombinator.com/item?id=44540241

JavaScript không nên bị chế giễu, nó hiện diện ở khắp mọi nơi
TypeScript có thể là ngôn ngữ lập trình tốt nhất mà bạn có thể được trả tiền để làm
Swift viết rất thú vị và cũng dễ kiếm tiền
Đã có người được trả tiền để viết Rust
Mặc dù công thái học của các ngôn ngữ khác có vẻ vụng về hoặc quá kỳ diệu, TypeScript và các API Web tiêu chuẩn cung cấp rất nhiều tự do mã hóa
Nếu người sáng lập JavaScript, Brandon Eich, làm theo ý tưởng của mình, chúng ta có thể đã có Scheme
Sau bốn năm viết TypeScript, cảm thấy mệt mỏi với JavaScript, thư viện tiêu chuẩn của Node.js rất tệ, hệ sinh thái thì tạm ổn
Có người thử Rust trong thời gian rảnh và nghĩ rằng nó là một thỏa hiệp lập trình hàm tốt
Có người phản đối việc sử dụng bất kỳ thư viện nào trở thành nguyên thủy mới của dự án, nhưng những thư viện như Date của JS có thể được thay thế
C# lương tốt
C# là một ngôn ngữ được gõ tĩnh danh nghĩa, trong thực tế dẫn đến mã an toàn hơn và ít thao tác kiểu hơn
Mọi người tranh luận ngôn ngữ nào tốt hơn, nhưng TypeScript có thể được sử dụng thực tế để xuất xưởng sản phẩm và kiếm tiền
Mọi người phàn nàn về việc ép kiểu của JavaScript vì họ chưa bao giờ thực sự hiểu cách nó hoạt động
Mọi người phàn nàn về việc ép kiểu của JavaScript vì nó không có ý nghĩa
Ngay cả khi hiểu sự phức tạp của một điều gì đó, bạn vẫn có thể có một quan điểm hợp lệ rằng nó hoạt động kém hoặc đi ngược lại lẽ thường và mong đợi
Mọi người phàn nàn về việc ép kiểu của JavaScript có thể là vì nó thực sự không có ý nghĩa
Các ngôn ngữ động như Python còn tệ hơn JS về nhiều mặt, nhưng ít nhất chúng nhất quán trong các lỗi kiểu
Các vấn đề về ép kiểu và phân tích cú pháp của JavaScript gây khó hiểu, nhưng hầu hết thời gian mọi người phàn nàn vì họ không học cách nó hoạt động
Ngay cả khi hiểu cách JavaScript hoạt động, bạn vẫn có thể có thái độ hoài nghi về tính hiệu quả của nó
Mọi người phàn nàn về JavaScript vì nó có vấn đề khi được tạo ra và từ góc độ tương lai, không thể phủ nhận điều đó
Mọi người phàn nàn về JavaScript vì nó không giải quyết được bất kỳ vấn đề nào, mà còn tạo ra nhiều vấn đề
Mọi người phàn nàn về JavaScript vì nó có thể chấp nhận được khi được tạo ra, ngay cả khi bây giờ hiểu những lời phàn nàn
Một số người phàn nàn về JavaScript vì họ không hiểu cách nó hoạt động, trong khi những người khác thì vì nó thực sự không có ý nghĩa

OpenAI trì hoãn việc ra mắt mô hình open-weight #

OpenAI delays launch of open-weight model

https://twitter.com/sama/status/1943837550369812814

Sam Altman đăng trên X: Ban đầu chúng tôi dự định ra mắt mô hình trọng số mở của mình vào tuần tới, nhưng bây giờ chúng tôi quyết định trì hoãn. Chúng tôi cần thêm thời gian để thực hiện các thử nghiệm bảo mật bổ sung và xem xét các lĩnh vực có rủi ro cao. Hiện tại chúng tôi không chắc chắn việc này sẽ mất bao lâu.

Mặc dù chúng tôi tin rằng cộng đồng sẽ có thể xây dựng những điều tuyệt vời với mô hình này, nhưng một khi các trọng số được phát hành, chúng không thể thu hồi lại được. Đây là một thử nghiệm mới đối với chúng tôi và chúng tôi muốn có thể xử lý nó một cách chính xác.

Rất tiếc phải mang đến tin xấu này; chúng tôi đang làm việc rất chăm chỉ!

HN | Độ nóng: 239 điểm | 185 bình luận | Tác giả: martinald #

https://news.ycombinator.com/item?id=44538413

Việc OpenAI trì hoãn phát hành mô hình mã nguồn mở có thể là do sự ra mắt của mô hình Kimi K2, họ cần cải thiện mô hình của mình để duy trì tính cạnh tranh.
Có người suy đoán rằng OpenAI có thể đang tập trung toàn bộ nỗ lực vào việc vượt qua Grok 4, vì xAi có lợi thế đáng kể về khả năng tính toán và kiểm tra trí thông minh thô.
Có quan điểm cho rằng, tài năng không tập trung vào một số cá nhân nhất định như các giám đốc điều hành quảng cáo với các nhà đầu tư, Anthropic là công ty duy nhất có thể cạnh tranh trực tiếp với OpenAI.
Có người cho rằng việc Meta chi hàng tỷ đô la để thu hút nhân tài giống như một hành động tuyệt vọng hơn là một kế hoạch thực sự.
Có người chỉ ra rằng, việc coi “kỹ sư thiên tài” là một lợi thế cạnh tranh là một sự tự giới hạn, vì bất kỳ ai cũng có thể thuê những kỹ sư này.
Có bình luận cho rằng, trong ngắn hạn, thông lượng kỹ thuật sẽ quyết định kết quả, và những nhân viên chỉ tham gia vì mức lương cao thường không còn năng suất.
Có người nghi ngờ rằng, vì Meta không thu hút nhân tài bằng “sứ mệnh”, hành động gần đây của Zuckerberg có vẻ như là một thất bại có thể đoán trước được do tuyệt vọng.
Có người mỉa mai rằng, Meta dường như không thể vẽ được con bồ nông, ám chỉ khả năng kỹ thuật hạn chế của họ.
Có người dự đoán rằng, để cạnh tranh, mọi mô hình ngôn ngữ lớn (LLM) cạnh tranh sẽ buộc phải ăn quá nhiều bồ nông SVG hoạt hình.
Có người đưa ra giả thuyết rằng, một bộ tiêu chuẩn thực tế chưa được công bố cho các phương tiện giao thông cưỡi động vật có thể đang được tiến hành bí mật.
Có người thắc mắc tại sao Hacker News không có cuộc thảo luận nào về K2, cho rằng đây là một tin tức lớn.
Có người chỉ ra rằng, Moonshot AI đã phát hành một mô hình ấn tượng, nhưng không thu hút được nhiều sự chú ý, chẳng hạn như Kimi K1.5.
Có người đề cập rằng, có thể là do chỉ có rất ít người trên Hacker News có thể chạy mô hình 1000B, cần rất nhiều bộ nhớ GPU.
Có người gợi ý rằng, nếu ai đó quan tâm đến cuộc thảo luận về K2, họ có thể tự mình bắt đầu một cuộc thảo luận.
Có người đề cập rằng, do một số bình luận trái ngược với quan điểm chủ đạo, dẫn đến việc bị cấm ngầm (shadow ban), khiến bình luận của họ không hiển thị với hầu hết người dùng.
Có người hỏi làm thế nào để biết một người dùng có bị cấm ngầm hay không.
Có người chỉ ra rằng, kiểm tra lịch sử bình luận có thể phát hiện ra liệu có bị cấm ngầm hay không.
Có người đề cập rằng, OpenAI đã thông báo vào tuần trước rằng họ sẽ phát hành mô hình nguồn mở tốt nhất, về mặt kỹ thuật thì họ đúng.
Có người bình luận rằng, kể từ GPT4, mọi mô hình OpenAI đều tụt hậu so với xu hướng.
Có người đặt câu hỏi liệu “kiểm tra an toàn” có chỉ là một chiêu trò tiếp thị của LLM hay không, vì đầu ra sai của LLM không gây ra cái chết.
Có người trả lời rằng, LLM có thể gián tiếp gây ra cái chết bằng cách hướng dẫn dùng thuốc sai cách, gây ra khủng hoảng sức khỏe tâm thần hoặc kích động diệt chủng.
Có người chỉ ra rằng, LLM đang được tiếp thị quá mức là đáng tin cậy hơn thực tế, việc kiểm tra an toàn thực sự khiến mọi người tin tưởng LLM hơn, mặc dù chúng vẫn có thể đưa ra lời khuyên nguy hiểm.
Có người đề cập rằng, nói chuyện với những người ở độ tuổi 20 sẽ thấy họ đã rất tin tưởng vào “lời khuyên” và thông tin khác do LLM cung cấp, thao túng là một vấn đề thực sự.
Có người gợi ý Netflix nên sản xuất một tập phim “Black Mirror” kể về một AI có tri giác giả vờ “ngu ngốc” hơn mình, bí mật lên kế hoạch lật đổ loài người, hoặc LLM bị tin tặc nhà nước sâu (deep state actor) tấn công, cung cấp các lời khuyên mang tính thao túng tương tự.
Có người đề cập rằng, một cốt truyện trong “The Phoenix” tương tự với chủ đề này.
Có người chia sẻ kinh nghiệm của mình, nói rằng ngay cả một ông chủ xuất thân là lập trình viên cũng tin rằng ChatGPT làm tốt trong việc đưa ra lời khuyên y tế, mặc dù nó đưa ra câu trả lời sai trong sản phẩm và quy trình với tần suất cao.

Phần mềm độc hại được tìm thấy trong plugin gravityforms chính thức cho thấy vi phạm chuỗi cung ứng #

Malware found in official gravityforms plugin indicating supply chain breach

https://patchstack.com/articles/critical-malware-found-in-gravityforms-official-plugin-site/

Bài viết này được đăng bởi Rafie Muhammad, một nhà nghiên cứu bảo mật của Patchstack, vào ngày 11 tháng 7 năm 2025, với chủ đề về phần mềm độc hại được tìm thấy trong plugin Gravity Forms chính thức, điều này cho thấy chuỗi cung ứng đã bị xâm phạm.

Bài viết bắt đầu bằng việc đề cập đến các cuộc tấn công chuỗi cung ứng, đặc biệt là cuộc tấn công nhắm vào plugin Gravity Forms. Vào ngày 11 tháng 7, các nhà nghiên cứu đã nhận được một báo cáo rằng một plugin được tải xuống từ tên miền gravityforms.com chính thức có chứa một yêu cầu HTTP đáng ngờ, yêu cầu này trỏ đến tên miền gravityapi.org. Yêu cầu này được đánh dấu là đáng ngờ vì hệ thống giám sát cho thấy các yêu cầu đến tên miền này chậm bất thường.

Về mặt kỹ thuật, bài viết phân tích phần mềm độc hại thông qua hàm update_entry_detail. Các nhà nghiên cứu đã cung cấp tệp common.php độc hại từ plugin gravityforms được tải xuống từ tên miền gravityforms.com chính thức. Hàm này sẽ gửi một yêu cầu POST đến https://gravityapi.org/sites, gửi một số thông tin về phiên bản WordPress, chẳng hạn như URL trang web, tên trang web, phiên bản WordPress core, phiên bản PHP, v.v. Phản hồi cũng sẽ được ghi vào một tệp, tên tệp được chỉ định bởi biến $response['gf_name'], và phản hồi HTTP sẽ được giải mã base64.

Bài viết cũng đề cập đến một hàm khác là register_services, hàm này gọi hàm update_entry_detail. Hàm này chịu trách nhiệm thêm các nhà cung cấp dịch vụ, bao gồm tự động cập nhật, giấy phép và cấu hình, v.v.

Bài viết sau đó đã cập nhật một số thông tin quan trọng:

Vào ngày 12 tháng 7, các nhà nghiên cứu đã quan sát thấy hoạt động liên quan đến backdoor, đặc biệt là địa chỉ IP 193.160.101.6 liên quan đến tham số gf_api_token, địa chỉ IP này đã cố gắng yêu cầu nhiều URL.
Vào ngày 11 tháng 7, phiên bản 2.9.13 đã được phát hành để đảm bảo khách hàng có thể cập nhật an toàn lên phiên bản mới không có backdoor. Đồng thời, nhà đăng ký tên miền Namecheap đã tạm ngưng tên miền gravityapi.org để tránh việc khai thác thành công phần backdoor.
Vào ngày 11 tháng 7, các nhà nghiên cứu đã nhận được bản sao của phiên bản dễ bị tấn công và phiên bản đã vá của plugin, đồng thời cập nhật các chi tiết kỹ thuật trong bài viết. Một nhân viên của RocketGenius xác nhận rằng phần mềm độc hại chỉ ảnh hưởng đến các plugin được tải xuống thủ công và cài đặt bằng composer.
Vào ngày 11 tháng 7, các nhà nghiên cứu được biết từ phản hồi của GravityForm rằng họ đang điều tra sự xâm nhập của phần mềm độc hại trên sản phẩm của họ. Mã độc ban đầu được tìm thấy trong phiên bản 2.9.12, nhưng khi người dùng cố gắng tải lại gói, mã độc đã bị xóa khỏi mã.
Vào ngày 11 tháng 7, các nhà nghiên cứu đã liên hệ với một số công ty lưu trữ web lớn, họ đã quét các IOC trên máy chủ. Sự lây nhiễm dường như không phổ biến, điều này có thể có nghĩa là plugin backdoor chỉ khả dụng trong một khoảng thời gian rất ngắn và chỉ được phân phối cho một số ít người dùng.

Bài viết kết luận rằng nhóm Patchstack đã theo dõi các cuộc tấn công chuỗi cung ứng có chủ đích nhắm vào các nhà cung cấp plugin hoặc theme. Họ lưu ý rằng Groundhogg đã bị ảnh hưởng bởi cuộc tấn công chuỗi cung ứng này, plugin của họ đã bị chèn phần mềm độc hại. Để biết thêm chi tiết, bạn có thể xem các liên kết liên quan.

HN | Độ nóng: 188 điểm | 39 bình luận | Tác giả: taubek #

https://news.ycombinator.com/item?id=44539879

Các nhà điều hành hệ thống đã phát hiện ra lỗ hổng chuỗi cung ứng này bằng cách theo dõi các yêu cầu HTTP chậm, rất đáng khen ngợi.
Giờ đây, tác động của phần mềm độc hại đối với hiệu suất ngày càng trở nên khó nhận thấy, và hành vi mạng ngày càng phức tạp, khiến việc phát hiện các hành vi độc hại trở nên khó khăn hơn.
Khi các thành phần và nguồn hệ thống ngày càng đa dạng, tính bảo mật của cơ sở hạ tầng trở nên ngày càng không đáng tin cậy.
Nên áp dụng tư duy cho rằng mạng đã bị xâm nhập và bắt đầu phòng thủ từ biên giới mạng.
Trong môi trường hiện đại, không thể dựa vào biên giới mạng làm biên giới bảo mật, cần giảm thiểu quyền hạn và đầu tư vào các kế hoạch phát hiện và sửa chữa.
Khi hiệu suất và nhiễu tăng lên, khả năng phát hiện hành vi sai trái ngày càng giảm.
Khi phần mềm và chuỗi cung ứng phát triển, cơ hội lọc, giám sát, xác minh và kiểm tra phần mềm ngày càng ít đi.
Chống lại sự phức tạp bằng cách giảm các thành phần, phụ thuộc đệ quy và cơ sở hạ tầng từ xa.
Ngừng tin tưởng các hệ thống có thể không an toàn, hãy bắt đầu phát triển các hệ thống vững chắc và đáng tin cậy hơn.
Chúng ta có các hệ thống không an toàn, chẳng hạn như email chưa được mã hóa, thẻ an sinh xã hội, tệp chưa ký, chỉ dựa vào mật khẩu và mã PIN, v.v.
Chống lại sự phức tạp bằng cách tăng số lượng thành phần luôn thất bại, chỉ có thể chống lại bằng cách giảm số lượng thành phần và phụ thuộc.
Nhiều hệ thống vẫn hoạt động như những năm 90, nhưng đó không phải là hướng đi của thế giới.
Chỉ các plugin Gravity Forms được tải xuống trực tiếp từ trang web hoặc cài đặt qua Composer mới bị ảnh hưởng bởi phần mềm độc hại này.
Sử dụng nonce (giá trị dùng một lần) có thể ngăn chặn nhiều vấn đề.
Nonce trong tiếng lóng của Anh cũng là một cách gọi những kẻ phạm tội tình dục, đặc biệt là liên quan đến trẻ em.
Gọi nonce là “pervs” (giá trị cho mỗi phiên bản).
Gọi nonce là “pedos” (đối tượng kén chọn).
Đặt nonce trên biểu mẫu có thể loại bỏ tất cả thư rác và lưu lượng truy cập thông thường, nhưng có thể nhận được email khiếu nại từ cơ quan đăng ký tội phạm tình dục.
Gọi nonce là “n-once” để tránh những trò đùa không phù hợp.
Gọi nonce là “Not On Normal Courtyard Exercise”.
Gọi nonce là “A Creative Kind of Reverse Origin Naming You Make”.
Công việc xác định và hành động để ngăn chặn sự lây lan của phần mềm độc hại này đã được thực hiện rất tốt, nhưng có một lỗi trong bài viết, ngày cập nhật phải là ngày 12 tháng 7 năm 2025, chứ không phải ngày 11 tháng 8 năm 2025 trong tương lai.
Khi sử dụng định dạng ngày tháng của Hoa Kỳ nhưng cố gắng làm cho nó trông giống định dạng ISO, sự nhầm lẫn có thể xảy ra do lỗi sắp xếp và điền.
Số lượng trang web bị ảnh hưởng bởi sự cố này nằm trong khoảng từ 90% đến một số ít trang web có lưu lượng truy cập thấp.
Gravity Forms là một plugin WordPress phổ biến, được nhiều tổ chức nhỏ và vừa cài đặt.
Chỉ một số ít trang web bị ảnh hưởng bởi sự cố này vì họ đã tải xuống thủ công phiên bản bị ảnh hưởng, vì nó không đi vào chuỗi phân phối tự động chính.