2025-07-29 Top Stories #
Ứng dụng xác minh độ tuổi của EU sẽ cấm mọi hệ thống Android không được cấp phép bởi Google #
EU age verification app to ban any Android system not licensed by Google
https://www.reddit.com/r/degoogle/s/YxmPgFes8a
Bạn hiện đang gặp phải giới hạn bảo mật mạng. Để tiếp tục truy cập, bạn cần đăng nhập vào tài khoản Reddit của mình hoặc sử dụng mã thông báo nhà phát triển.
Nếu bạn cho rằng mình đã bị chặn nhầm, vui lòng gửi phiếu yêu cầu bên dưới và chúng tôi sẽ điều tra.
Đăng nhập Gửi phiếu yêu cầu
Bản tóm tắt trên bao gồm nội dung chính của trang web, cung cấp cho người dùng các giải pháp khi gặp phải giới hạn bảo mật mạng, bao gồm đăng nhập vào tài khoản Reddit hoặc sử dụng mã thông báo nhà phát triển, cũng như tùy chọn gửi phiếu yêu cầu khi bị chặn nhầm. Bản tóm tắt cố gắng giữ nguyên cấu trúc của văn bản gốc để người đọc có thể hiểu nội dung chính của trang web một cách trực quan hơn.
HN | Độ nóng: 972 điểm | 625 bình luận | Tác giả: cft #
https://news.ycombinator.com/item?id=44705240
- Ứng dụng xác minh độ tuổi của EU yêu cầu phụ thuộc vào các dịch vụ của Google, làm sâu sắc thêm sự phụ thuộc của EU vào các gã khổng lồ công nghệ của Mỹ, làm tăng sự kiểm soát của Mỹ đối với Internet.
- Việc bắt buộc sử dụng các dịch vụ của Google có thể vi phạm luật về quyền riêng tư và tính toàn vẹn của các quốc gia thành viên EU.
- Việc EU thúc đẩy xác minh độ tuổi có thể là khúc dạo đầu cho việc yêu cầu tất cả các bài đăng trên mạng xã hội phải sử dụng ID, có thể hạn chế quyền tự do ngôn luận.
- Có một mâu thuẫn giữa việc Ủy ban Châu Âu giảm sự phụ thuộc vào các dịch vụ FAANG và việc coi Google Play là tiêu chuẩn trên thực tế.
- Các cơ quan chính phủ EU thiếu sự phối hợp trong luật pháp kỹ thuật, thiếu giao tiếp giữa các nhánh khác nhau.
- Ủy ban Châu Âu được lãnh đạo bởi một chủ tịch do một người bổ nhiệm, không chịu trách nhiệm trước bất kỳ ai, và quốc hội chỉ có thể đóng dấu cao su cho các luật mà nó thông qua.
- Sự thiếu mạch lạc của Ủy ban Châu Âu là do tư duy thiếu mạch lạc của lãnh đạo cấp cao.
- EU/Đảng Nhân dân Châu Âu bảo thủ/cánh hữu hơn mức mà nhiều công dân có thể chấp nhận.
- Việc EU thúc đẩy kiểm duyệt nhiều hơn là một lập luận của cánh tả, nhưng các đảng cánh tả đã bỏ phiếu chống lại kiểm duyệt trong Nghị viện Châu Âu, trong khi các đảng bảo thủ/tân hữu bỏ phiếu ủng hộ kiểm duyệt.
Phân tích hiệu năng và đo từ xa của Trae IDE, bản fork VSCode của ByteDance #
Performance and telemetry analysis of Trae IDE, ByteDance’s VSCode fork
https://github.com/segmentationf4u1t/trae_telemetry_research
Phân tích Hiệu năng và Đo từ xa của Trae IDE: Phân tích Chuyên sâu về nhánh VSCode của ByteDance
Tóm tắt #
Báo cáo phân tích này nhằm mục đích xem xét các vấn đề đáng lo ngại về hiệu suất và quyền riêng tư được phát hiện trong Trae IDE (phiên bản nhánh của Visual Studio Code do ByteDance phát triển). Những phát hiện chính bao gồm: tiêu thụ tài nguyên quá mức (số lượng tiến trình lên tới 33, trong khi VSCode chỉ có 9), dữ liệu vẫn tiếp tục được truyền ngay cả khi người dùng đã tắt chức năng đo từ xa trong cài đặt và các hành vi quản lý cộng đồng đáng ngờ.
Bối cảnh và phương pháp luận #
Khi đánh giá môi trường phát triển cho các dự án cá nhân, tôi đã thực hiện so sánh và phân tích ba IDE phổ biến: Visual Studio Code, Cursor và Trae (nhánh VSCode của ByteDance). Kết quả phân tích cho thấy có sự khác biệt đáng kể về mức sử dụng tài nguyên và hành vi mạng của chúng, điều này đáng để điều tra sâu hơn.
Môi trường thử nghiệm:
- Hệ điều hành: Microsoft Windows 11 Professional (Pro)
- CPU: Intel Core™ i7-14700KF
- Bộ nhớ (RAM): 64GB
- Dự án thử nghiệm: Mỗi IDE tải cùng một kho mã nguồn
- Công cụ giám sát: System Informer, Fiddler Everywhere
Phân tích tiêu thụ tài nguyên #
Số lượng tiến trình và mức sử dụng bộ nhớ
Các thử nghiệm ban đầu cho thấy sự khác biệt lớn về mức tiêu thụ tài nguyên: Các chỉ số sau khi cập nhật (v2.0.2):
- Số lượng tiến trình giảm từ 33 xuống còn khoảng 13
- Mức sử dụng bộ nhớ giảm xuống còn khoảng 2.5 GB
*Không bao gồm thư mục node_modules và target
Hình 1: Số lượng tiến trình do Trae tạo ra gấp 3.7 lần VSCode, và mức tiêu thụ bộ nhớ gấp 6.3 lần
Lo ngại về chủ quyền dữ liệu #
- Thu thập liên tục: Bỏ qua sở thích của người dùng, liên tục thu thập dữ liệu đo từ xa.
- Theo dõi chi tiết: Truyền tải thông tin chi tiết về hệ thống và thông tin sử dụng.
- Xử lý dữ liệu ở nước ngoài: Thông tin được chuyển đến cơ sở hạ tầng của ByteDance (một công ty Trung Quốc).
- Nhận dạng duy nhất: Theo dõi dài hạn thông qua nhiều định danh liên tục.
Vấn đề về sự tin tưởng và minh bạch #
- Cài đặt gây hiểu lầm: Công tắc đo từ xa dường như chỉ là hình thức, không có tác dụng.
- Hành vi không được ghi lại: Không tiết lộ rõ ràng các phương pháp thu thập dữ liệu.
- Đàn áp tiếng nói cộng đồng: Áp dụng biện pháp kiểm duyệt thay vì giao tiếp đối với những chỉ trích mang tính kỹ thuật.
Điểm cốt lõi:
- Mức sử dụng tài nguyên gấp 6 lần so với VSCode (tương đương với Cursor trong phiên bản 2.0.2).
- Cài đặt đo từ xa dường như chỉ là hình thức, không phải chức năng thực tế.
- Cơ chế phản hồi của cộng đồng bị tổn hại do kiểm duyệt nội dung.
- Thiếu minh bạch và kiểm soát của người dùng đối với các hoạt động thu thập dữ liệu.
HN | Độ nóng: 931 điểm | 335 bình luận | Tác giả: segfault22 #
https://news.ycombinator.com/item?id=44703164
- Việc tắt tính năng đo từ xa yêu cầu khởi động lại trình soạn thảo, nhưng cảnh báo khởi động lại đã bị bỏ qua trong quá trình thử nghiệm, điều này có thể làm cho kết quả thử nghiệm không hợp lệ.
- Việc tắt tính năng đo từ xa không hoạt động là vấn đề cốt lõi, nếu cần khởi động lại mà thử nghiệm bỏ qua điều này, thì kết quả thử nghiệm có thể không chính xác.
- Ngay cả khi tính năng đo từ xa bị tắt, các gói dữ liệu đo từ xa vẫn được gửi đi, đây là một quan sát hữu ích.
- Theia IDE là một sự thay thế cho VS Code, nó dựa trên Eclipse, có hỗ trợ LSP và backend trình soạn thảo Monaco.
- Bản dùng thử trực tuyến của Theia IDE yêu cầu đăng nhập, nhưng có thể đóng tab.
- Trang khám phá của Theia IDE cung cấp cái nhìn sâu sắc về cách sử dụng và giao diện của nó.
- Hỗ trợ Markdown của VS Code, đặc biệt là chức năng kéo và thả để chèn liên kết tệp và hình ảnh, là điều mà các trình soạn thảo khác không có.
- Obsidian hỗ trợ dán hình ảnh từ clipboard, có thể cũng hỗ trợ kéo và thả.
- Dendron là Obsidian trong VS Code, miễn phí và mã nguồn mở.
- Dự án Dendron hiện đang ở trạng thái “zombie”, không nên dành thời gian sử dụng.
- Mặc dù trang web Dendron có tình trạng không tốt, nhưng tiện ích mở rộng rất hữu ích và hầu như không có lỗi gây khó chịu.
- Google Cloud Shell cũng sử dụng Theia.
- Eclipse khá phổ biến trong các doanh nghiệp, nhưng do độ phức tạp và đường cong học tập, mọi người thường tránh nó.
- Một trong những kiến trúc sư chính của VSCode trong hệ sinh thái Eclipse là kiến trúc sư Eclipse, đồng thời là đồng tác giả của cuốn sách nổi tiếng GoF, Erich Gamma.
- Mặc dù tôn trọng những đóng góp của Erich cho Eclipse, nhưng do sự không tin tưởng vào Microsoft, sẽ không theo ông sử dụng VSCode.
- Trong công nghệ hiện đại, rất khó để tránh hoàn toàn các sản phẩm của Microsoft.
- Theia khác với Eclipse IDE, nó được viết bằng JavaScript và không chia sẻ codebase của Eclipse.
- Eclipse vẫn hoạt động.
- Việc cài đặt gói mở rộng Java của VSCode sẽ chạy phiên bản headless của Eclipse JDT, điều này không hề nhẹ.
- Java thường không nhẹ, hầu hết các dự án Java đều liên quan đến việc thêm ngày càng nhiều thư viện, framework, kiểm tra và thử nghiệm.
- Nếu triển khai lại toàn bộ dự án, kích thước code sẽ tương tự, JDT language server không phải là phần mềm headless cần UI.
- Có thể đặt chế độ khởi động thành nhẹ, chỉ khởi động language server cú pháp.
- So với việc fork VS Code, Theia là một lựa chọn tốt hơn vì tính mô-đun và khả năng bảo trì của nó.
Đủ AI copilots rồi, chúng ta cần AI HUDs #
Enough AI copilots, we need AI HUDs
https://www.geoffreylitt.com/2025/07/27/enough-ai-copilots-we-need-ai-huds
Bài viết này được Geoffrey Litt viết vào tháng 7 năm 2025, chủ đề là về những phê bình và suy nghĩ về thiết kế trí tuệ nhân tạo hiện đại. Bài viết bắt đầu bằng việc trích dẫn lời phê bình của nhà nghiên cứu Mark Weiser năm 1992 về “phi công phụ” như một phép ẩn dụ về trí tuệ nhân tạo. Weiser đã bày tỏ sự phản đối của mình đối với ý tưởng về trợ lý cá nhân tự động hóa các tác vụ và hiểu toàn diện bối cảnh của người dùng trong một sự kiện tại MIT Media Lab. Ông dùng ví dụ về lái máy bay để minh họa rằng, thay vì để máy tính đóng vai trò là một “phi công phụ” để giúp bạn bay, thì tốt hơn là thiết kế một buồng lái cho phép phi công nhận thức một cách tự nhiên về môi trường xung quanh.

Bài viết tiếp tục giới thiệu mục tiêu của Weiser, đó là hiện thực hóa “máy tính vô hình” - không phải là loại trợ lý thu hút sự chú ý của bạn, mà là hòa nhập vào bối cảnh, trở thành phần mở rộng của cơ thể bạn. Weiser đã sử dụng slide về giao diện máy bay năm 1992 để minh họa quan điểm của mình. Bài viết đề cập đến một công cụ trong máy bay hiện đại - màn hình hiển thị trên kính chắn gió (HUD), nó hiển thị thông tin bay như đường chân trời và độ cao trực tiếp trên màn hình trong suốt trong tầm nhìn của phi công, đây chính là sự thể hiện triết lý của Weiser.
Bài viết tiếp tục thảo luận về HUD trong thiết kế phần mềm hiện đại. Ví dụ, kiểm tra chính tả là một ví dụ quen thuộc về HUD, nó không thảo luận về chính tả với bạn như một “cộng tác viên ảo”, mà ngay lập tức thêm dấu gạch dưới màu đỏ khi bạn viết sai chính tả, cho phép bạn có một cảm giác mới mà trước đây bạn chưa từng có. Một ví dụ cá nhân khác là trình gỡ lỗi tùy chỉnh trong mã hóa AI, nó trực quan hóa hành vi của chương trình, cho phép bạn có HUD, mở rộng khả năng nhận thức của bạn.
Bài viết chỉ ra rằng, HUD và “phi công phụ” đều có những tình huống áp dụng riêng, nhưng tác giả cho rằng bất kỳ ai nghiêm túc xem xét thiết kế AI đều nên xem xét các yếu tố không phải là hình thức “phi công phụ”, những yếu tố này mở rộng tư duy của con người một cách trực tiếp hơn. Tác giả đưa ra rằng, đối với những công việc hàng ngày có thể dự đoán được, có thể phù hợp để ủy thác cho một phi công phụ/trợ lý ảo, nhưng khi bạn theo đuổi những kết quả phi thường, lựa chọn tốt nhất có thể là trang bị cho các chuyên gia con người những khả năng mới.
Bài viết cuối cùng đề xuất một số tài liệu đọc thêm, bao gồm “Augmenting Human Intellect with AI” (Tăng cường Trí tuệ Con người bằng AI) của Michael Nielsen và Shan Carter, cũng như các cuộc thảo luận về triết lý HUD giao thoa với việc tạo phần mềm theo yêu cầu.
Tóm lại, bài viết này khám phá vấn đề về phép ẩn dụ “phi công phụ” trong thiết kế trí tuệ nhân tạo, và đề xuất HUD như một giải pháp thay thế để mở rộng tư duy của con người một cách trực tiếp hơn. Tác giả thông qua các ví dụ như buồng lái máy bay và kiểm tra chính tả, đã minh họa ứng dụng của HUD trong thiết kế phần mềm hiện đại, và thảo luận về tính phù hợp của HUD và “phi công phụ” trong các tình huống khác nhau.
HN | Độ nóng: 788 điểm | 231 bình luận | Tác giả: walterbell #
https://news.ycombinator.com/item?id=44705445
- Bộ anime Nhật Bản năm 1991 “Future GPX Cyber Formula” đã thảo luận về sự so sánh tương tự giữa AI Copilot và HUD
- “Anime Yukikaze” cho thấy tầm quan trọng của việc kết hợp trực giác của con người với trí tuệ nhân tạo
- Sự phát triển của AI trong thực tế gợi nhớ đến các tình tiết trong các tác phẩm khoa học viễn tưởng Nhật Bản
- Lĩnh vực đua xe đã có những thảo luận về “lái xe bằng dây”, trong tương lai có thể phát triển thành “kiểm soát bởi phụ lái”
- Vai trò của hoa tiêu/người điều hướng trong các cuộc đua rally tương tự như HUD, cung cấp khả năng nhận thức nâng cao
- Công nghệ HUD hiện tại không thể xử lý băng thông và tốc độ dữ liệu cần thiết cho các cuộc đua rally
- Khi công nghệ AI đủ tin cậy, việc sử dụng vị trí GPS được hỗ trợ bởi ghi chú và gia tốc kế có thể an toàn hơn so với việc dựa vào AI
- Mọi người đã từng thảo luận về vấn đề tăng cường khả năng của con người trong giai đoạn đầu của máy tính
- “Future GPX Cyber Formula” có thể được tìm thấy trên YouTube
- Có nhu cầu về bản đồ nhiệt hiển thị mọi dấu hiệu khiến mô hình ngạc nhiên về tệp nguồn
- Công nghệ phân tích mã AI tương đối lạc hậu, trái ngược với sự phổ biến của công nghệ tạo mã
- Cần một công cụ có thể hiểu các dấu hiệu “đáng ngạc nhiên”, điều này có thể có nghĩa là lỗi hoặc chức năng độc đáo
- Một công cụ như vậy có thể không phải là một điểm bán hàng tiếp thị tốt, vì chúng yêu cầu người dùng có khả năng lập trình
- Cần lặp lại để ánh xạ xác suất log của mô hình lên bản đồ nhiệt, ánh xạ trực tiếp sẽ tạo ra nhiều nhiễu
- Thông qua UI, khám phá các lựa chọn triển khai và quyết định thiết kế ẩn trong giao diện trợ lý truyền thống
- Các phần mã đáng ngạc nhiên có thể cần tài liệu tốt hơn, nhưng việc giải thích cách thuật toán hoạt động sẽ làm cho bản thân mã bớt đáng ngạc nhiên hơn
- Chất lượng mã có thể được đo bằng “WTFs mỗi phút”, giờ đây LLM có thể diễn đạt điều này
Tom Lehrer đã qua đời #
Tom Lehrer has died
https://www.nytimes.com/2025/07/27/arts/music/tom-lehrer-dead.html
Tom Lehrer, một nhà toán học và ca sĩ nổi tiếng với phong cách châm biếm âm nhạc độc đáo của mình, đã qua đời vào ngày 27 tháng 7 năm 2025 tại Cambridge, Massachusetts, Hoa Kỳ, hưởng thọ 97 tuổi. Ông đã giành được sự ủng hộ rộng rãi trong khuôn viên các trường đại học và Greenwich Village vào những năm 1950 và 1960, được yêu thích nhờ lời bài hát dí dỏm và thường mang tính hài hước đen tối. Phong cách âm nhạc của Lehrer thường vui tươi, trong khi lời bài hát lại sắc sảo, châm biếm và khó quên. Các tác phẩm tiêu biểu của ông bao gồm “The Vatican Rag” (Điệu Nhạc Giáo Hoàng) và “Poisoning Pigeons in the Park” (Đầu Độc Chim Bồ Câu Trong Công Viên).
Lehrer sinh ngày 9 tháng 4 năm 1928 tại Manhattan, từ nhỏ đã bộc lộ tài năng âm nhạc xuất chúng. Ông theo học chuyên ngành toán học tại Đại học Harvard và lấy bằng cử nhân và thạc sĩ. Trong thời gian học, ông bắt đầu sáng tác các bài hát cho bản thân và bạn bè, nhanh chóng nhận được sự chú ý. Năm 1945, bài hát châm biếm về bóng đá “Fight Fiercely, Harvard” của ông bắt đầu được yêu thích. Năm 1953, ông phát hành album đầu tay “Songs by Tom Lehrer”, bất ngờ đạt được thành công, với doanh số lên tới hàng trăm nghìn bản.
Mặc dù sự nghiệp âm nhạc của ông đã thành công, Lehrer luôn đặt sự nghiệp học thuật lên hàng đầu. Ông giảng dạy tại Đại học Harvard, Viện Công nghệ Massachusetts và Đại học California, đồng thời làm việc tại Ủy ban Năng lượng Nguyên tử. Năm 1960, ông ngừng biểu diễn trực tiếp, mặc dù sau đó đã có sự trở lại ngắn ngủi, nhưng ông không còn biểu diễn công khai sau năm 1967.
Lời bài hát của Lehrer thường đề cập đến các vấn đề chính trị và xã hội, đặc biệt là vào những năm 1960, ông đã sáng tác một số bài hát cho chương trình châm biếm “That Was the Week That Was” của NBC, bao gồm “A Song for World War III” (Bài Hát Cho Thế Chiến Thứ Ba) và “Wernher von Braun” (Tiến Sĩ Wernher von Braun). Bài hát “The Vatican Rag” của ông từng bị các nhân vật tôn giáo lên án vì nội dung khiêu khích của nó.
Sáng tác của Lehrer dần ít đi, năm 1971 ông đã sáng tác một số bài hát giáo dục cho chương trình thiếu nhi “The Electric Company” của PBS. Mặc dù ông đã trải qua sự trở lại vào năm 1980 và 1981, đồng thời dàn dựng vở nhạc kịch “Tomfoolery” ở London và New York, nhưng ông cho biết lý do ông ngừng viết là do thất vọng với sự nghiêm trọng của chính trị xã hội.
Không lâu trước khi qua đời, Lehrer tuyên bố từ bỏ bản quyền của tất cả các bài hát của mình, cho phép bất kỳ ai tùy ý sử dụng lời bài hát của ông, thể hiện thái độ cởi mở của ông đối với nghệ thuật. Ông có một cuộc sống khá kín tiếng, không kết hôn và không có con, trước khi qua đời sống giữa Cambridge và Santa Cruz, California. Sự ra đi của Lehrer đánh dấu sự kết thúc của một kỷ nguyên, và các tác phẩm của ông vẫn có ảnh hưởng sâu sắc đến nhiều người.
HN | Độ nóng: 622 điểm | 109 bình luận | Tác giả: detaro #
https://news.ycombinator.com/item?id=44702782
- Tom Lehrer đã từ bỏ bản quyền của tất cả các bài hát, đưa chúng vào phạm vi công cộng, cho phép mọi người tự do sử dụng và diễn giải
- Ai đó đã sao lưu tất cả các tác phẩm của Tom Lehrer và khuyến khích những người khác cũng làm như vậy
- Có người lo ngại về vấn đề bảo quản các tác phẩm kỹ thuật số, đề nghị đồng thời tạo ra các bản sao vật lý
- Có người chỉ ra tính bền vững của tiêu chuẩn USB, cho rằng nó sẽ tồn tại mãi mãi
- Có người mỉa mai rằng tiêu chuẩn USB sẽ tồn tại cho đến bản cập nhật tiếp theo
- Có người ca ngợi hành động của Tom Lehrer và hy vọng nhiều người noi theo
- Có người bày tỏ nghi ngờ về việc Tom Lehrer có thực sự sở hữu bản quyền của tất cả các bài hát hay không
- Có người giải thích rằng bài hát và bản ghi âm là khác nhau, bản quyền của bài hát có thể do nhà xuất bản kiểm soát
- Có người chỉ ra rằng, thông thường chỉ trong các giao dịch quản lý thuần túy thì bài hát mới không thuộc sở hữu của hãng đĩa, còn trong hầu hết các trường hợp, một phần quyền sở hữu bài hát sẽ được chuyển cho nhà xuất bản
- Có người xác nhận rằng các tác phẩm của Tom Lehrer là tự xuất bản
- Có người đề cập đến khiếu hài hước của Tom Lehrer và những đóng góp của ông trong giảng dạy
- Có người nhớ lại các khóa học toán học mà Tom Lehrer đã dạy ở trường đại học và bày tỏ sự ngưỡng mộ đối với phong cách giảng dạy của ông
Sử dụng VPN tăng vọt ở Anh khi các quy tắc an toàn trực tuyến mới có hiệu lực #
VPN use surges in UK as new online safety rules kick in
https://www.ft.com/content/356674b0-9f1d-4f95-b1d5-f27570379a9b
Luật An toàn Trực tuyến mới được thực thi gần đây ở Vương quốc Anh đã dẫn đến sự gia tăng đột biến trong việc sử dụng mạng riêng ảo (VPN), đặc biệt sau khi các hệ thống xác minh độ tuổi đối với nội dung người lớn và các ứng dụng truyền thông xã hội có hiệu lực. Các quy tắc mới này nhằm ngăn trẻ em dưới 18 tuổi truy cập nội dung khiêu dâm và các nội dung có hại khác. Cơ quan quản lý truyền thông Ofcom cho biết sẽ bắt đầu thực thi các biện pháp kiểm tra độ tuổi này.
Theo báo cáo, số lượng người dùng VPN đã tăng vọt kể từ khi các quy tắc mới được thực thi. Số lượng đăng ký hàng ngày của Proton VPN ở Vương quốc Anh đã tăng hơn 1800%, trong khi số lượng mua đăng ký VPN của Nord Security cũng tăng 1000%. Điều này cho thấy nhiều người trưởng thành lo ngại về tác động của luật xác minh độ tuổi phổ biến đối với quyền riêng tư của họ.
Ngoài việc tăng cường tìm kiếm và sử dụng VPN, nhiều chuyên gia công nghệ đã chỉ trích các nhà lập pháp vì thiếu kiến thức kỹ thuật, cho rằng những luật này sẽ khiến mọi người dễ dàng tìm ra cách lách các hạn chế hơn. Vương quốc Anh là quốc gia dân chủ đầu tiên thực hiện kiểm soát nội dung nghiêm ngặt như vậy, điều này khiến nước này trở thành một trường hợp thí điểm được toàn cầu quan tâm. Các nền tảng vi phạm các quy định mới có thể phải đối mặt với khoản tiền phạt lên tới 18 triệu bảng Anh.
Mặc dù Ofcom thừa nhận rằng việc kiểm tra độ tuổi không phải là “bất khả chiến bại”, nhưng họ cho biết biện pháp này sẽ giúp bảo vệ trẻ em khỏi các nội dung có hại. Các tiếng nói phản đối các quy định mới ngày càng gia tăng, một bản kiến nghị yêu cầu bãi bỏ Luật An toàn Trực tuyến đã thu hút hơn 280.000 chữ ký chỉ trong một tuần, thúc đẩy Quốc hội xem xét vấn đề này.
Chính phủ Anh khẳng định những quy tắc này sẽ không được đàm phán lại và hy vọng sẽ thiết lập quan hệ đối tác thương mại kỹ thuật số mới với Hoa Kỳ. Bộ trưởng Công nghệ Peter Kyle nhấn mạnh rằng các nền tảng phải chủ động ngăn chặn trẻ em trốn tránh các biện pháp an toàn, bao gồm cả việc chặn nội dung quảng bá VPN hoặc các phương pháp lách luật khác.
HN | Độ nóng: 598 điểm | 900 bình luận | Tác giả: mmarian #
https://news.ycombinator.com/item?id=44706653
- Luật mới, tin tức hoặc truyền thông ở Anh mô tả một xã hội bị đàn áp, yếm thế và sợ hãi, xã hội này ngầm chấp nhận hoặc ủng hộ việc chính phủ tăng cường giám sát và kiểm soát.
- Anh đang ngày càng trở nên độc đoán, gây thù địch cho phần lớn dân số, bất kể đảng phái chính trị nào.
- Thuế ở Anh đang tăng (đồng thời doanh thu thuế đang giảm), tội phạm không được kiểm soát, vấn đề nhập cư gây tranh cãi, nhưng GDP bình quân đầu người trì trệ hoặc thậm chí giảm, gây áp lực lên các dịch vụ.
- Ngày càng có nhiều người rời khỏi Anh, đặc biệt là những người có khả năng rời đi, dẫn đến tỷ lệ người sẵn sàng chịu đựng hiện trạng tăng lên.
- Anh luôn là một đế chế suy tàn, nhưng cho đến khi mạng xã hội trỗi dậy, các vấn đề mới trở nên nghiêm trọng.
- Sự suy tàn của Anh có thể bắt nguồn từ trước và sau Thế chiến thứ nhất, và sức mạnh quốc gia của Anh bắt đầu suy giảm rõ rệt sau chiến thắng trong Thế chiến thứ hai.
- Anh không phải là một quốc gia thần quyền, nếu bạn đang đề cập đến Thượng viện, thì đó là một sự hiểu lầm về chính phủ Anh.
- Người dân Anh có thể chưa nhận thức đầy đủ về sự suy tàn của đất nước, đặc biệt là trong lời nói và hành động trong quá trình Brexit.
- Brexit có thể là một phản ứng cảm tính, nhưng nó không giúp giải quyết vấn đề.
- Mọi người bỏ phiếu cho những người theo chủ nghĩa dân túy vì họ là triệu chứng của việc giới tinh hoa không xây dựng được một xã hội hiệu quả cho tất cả mọi người.
- Mọi người không bỏ phiếu cho những người theo chủ nghĩa dân túy một cách tình cờ, việc bỏ phiếu cho những người theo chủ nghĩa dân túy là một triệu chứng của sự thất bại của giới tinh hoa.
Copyparty – Biến hầu hết mọi thiết bị thành một máy chủ tập tin #
Copyparty – Turn almost any device into a file server
https://github.com/9001/copyparty
Trang web này nói về một dự án mã nguồn mở có tên là “copyparty”, một máy chủ tập tin di động với các tính năng như tải lên có thể khôi phục được tăng tốc, khử trùng lặp, WebDAV, FTP, TFTP, mạng không cấu hình, trình lập chỉ mục phương tiện, hình thu nhỏ, tất cả được tích hợp trong một tệp duy nhất, không cần phụ thuộc vào phần mềm khác. Dự án này sử dụng giấy phép MIT và có 6.6k sao và 201 nhánh trên GitHub. Đặc điểm dự án: - Hỗ trợ tải lên/tải xuống có thể khôi phục thông qua bất kỳ trình duyệt web nào.
- Máy chủ chỉ cần Python (2 hoặc 3), tất cả các phụ thuộc đều là tùy chọn.
- Hỗ trợ nhiều giao thức: HTTP, WebDAV, FTP, TFTP, SMB/CIFS.
- Cung cấp ứng dụng Android và phím tắt iPhone.
- Dự án cung cấp một máy chủ demo chỉ đọc, người dùng có thể truy cập để tìm hiểu về các chức năng của nó.
- Trang dự án cũng cung cấp ảnh chụp màn hình và video, hiển thị các đặc điểm như tải lên trình duyệt, cuộc thi tải lên, trình diễn chức năng. Bắt đầu nhanh: - Người dùng chỉ cần chạy
copyparty-sfx.py
để nhanh chóng bắt đầu sử dụng. - Dự án cũng cung cấp hướng dẫn truy cập qua Internet tại nhà và sử dụng trên máy chủ. Chức năng: - Dự án mô tả chi tiết các tính năng của nó và so sánh với các phần mềm tương tự khác.
- Các phần như phản hồi của người dùng, mục tiêu/triết lý của dự án, ghi chú chung, các vấn đề đã biết, các vấn đề không thuộc dự án, các thay đổi lớn và các câu hỏi thường gặp cũng được đề cập. Tài khoản và ổ đĩa: - Dự án hỗ trợ cài đặt quyền theo thư mục, theo người dùng. Tệp ẩn và bóng: - Dự án hỗ trợ ẩn các thư mục con cụ thể và các tệp/thư mục ẩn theo kiểu Unix. Truy cập trình duyệt: - Người dùng có thể truy cập máy chủ copyparty thông qua trình duyệt web và sử dụng các tab chính và phím tắt trong UI. Hình thu nhỏ và tải lên: - Người dùng có thể chuyển đổi giữa chế độ xem lưới và danh sách tệp bằng phím “g” hoặc phím windows.
- Hỗ trợ tải xuống lựa chọn thư mục hoặc tệp dưới dạng tệp zip hoặc tar.
- Người dùng có thể tải lên bằng cách kéo và thả tệp/thư mục vào trình duyệt web.
- Dự án cũng cung cấp các chức năng như tìm kiếm tệp, hoàn tác/xóa các tải lên vô tình, quản lý vòng đời của các tệp đã tải lên. Trình quản lý tệp và chia sẻ: - Người dùng có thể cắt/dán, đổi tên và xóa tệp/thư mục (nếu có quyền).
- Hỗ trợ chia sẻ tệp hoặc thư mục bằng cách tạo liên kết tạm thời. Đăng ký RSS và phát lại phương tiện: - Người dùng có thể sử dụng trình đọc RSS để theo dõi thư mục.
- Dự án cung cấp một trình phát phương tiện hỗ trợ hầu hết tất cả các định dạng âm thanh và hỗ trợ tạo và phát danh sách phát m3u8. Trình xem tệp văn bản và trình xem Markdown: - Dự án cung cấp trình xem tệp văn bản với các chức năng như truyền trực tuyến tệp nhật ký theo thời gian thực và hai trình soạn thảo Markdown. Tìm kiếm và cấu hình máy chủ: - Người dùng có thể tìm kiếm theo nhiều cách khác nhau như kích thước, ngày, đường dẫn/tên, thẻ MP3, v.v.
- Dự án hỗ trợ sử dụng tham số hoặc tệp cấu hình, hoặc cả hai để cấu hình máy chủ. Mạng không cấu hình và khử trùng lặp tệp: - Dự án hỗ trợ thông báo các dịch vụ đã bật trên mạng LAN và hỗ trợ khử trùng lặp tải lên dựa trên liên kết tượng trưng. Lập chỉ mục tệp và mẫu loại trừ: - Dự án hỗ trợ bật tìm kiếm nhạc, hoàn tác tải lên và chức năng khử trùng lặp tốt hơn, đồng thời cho phép thiết lập các mẫu loại trừ để tiết kiệm thời gian. Bảo vệ hệ thống tệp và quét lại định kỳ: - Dự án cung cấp các biện pháp bảo vệ để tránh duyệt các hệ thống tệp khác và hỗ trợ giám sát hệ thống tệp. Quy tắc tải lên và tải lên nén: - Người dùng có thể đặt quy tắc tải lên và tự động nén tệp khi tải lên.
Trang web này cung cấp thông tin chi tiết về dự án “copyparty”, bao gồm các chức năng, hướng dẫn sử dụng, tùy chọn cấu hình và phản hồi của cộng đồng, v.v.
HN | Độ nóng: 491 điểm | 87 bình luận | Tác giả: saint11 #
https://news.ycombinator.com/item?id=44711519
- Video demo của công cụ này rất ấn tượng, đặc biệt là chức năng khôi phục liền mạch việc tải lên và tải xuống tệp
- Gợi nhớ lại những trải nghiệm tải xuống thất bại khi sử dụng kết nối dial-up trong quá khứ
- Trước đây, cần các ứng dụng đặc biệt để xếp hàng và lên lịch tải xuống, điều này có vẻ rất bất tiện so với hiện tại
- Có người đề cập đến DAP (Download Accelerator Plus), coi đó là một phần tuổi thơ của họ
- Máy chủ glFTPd cho phép FXP (truyền tệp giữa các máy chủ), rất hữu ích cho những người dùng có băng thông hạn chế
- Bản thân giao thức FTP đã hỗ trợ tiếp tục tải xuống, không cần máy chủ hỗ trợ đặc biệt
- Các công cụ đặc biệt cũng cần tải xuống, đôi khi phải hy sinh thời gian tải xuống hoặc thử lại
- Hầu hết các tệp trong quá khứ được cung cấp qua FTP, hỗ trợ tiếp tục tải xuống
- Nhưng cũng có người cho rằng không phải hầu hết các tệp đều được cung cấp qua FTP, nhiều máy chủ HTTP không hỗ trợ
- FTP không thể khởi động lại kết nối PPP hoặc SLIP
- Có người nói rằng họ không cần phần mềm này, nhưng video được làm rất tốt, khiến họ muốn thử
- Nếu máy chủ khởi động lại trong quá trình tải lên, nó sẽ còn ấn tượng hơn nữa
- Có người đề cập đến BitTorrent, cho rằng nó tương tự như công cụ này
- Có người đề xuất nên tuân thủ tốt hơn HTTP RFCs để cải thiện trải nghiệm của nhà phát triển
- Có người đề cập đến chức năng “Race the beam”, cho biết trước đây chưa từng thấy cách làm việc như vậy
- NNCP được đề cập, nó được thiết kế để hỗ trợ các mạng bị hạn chế hoặc gián đoạn
- Có người cho rằng đây là giấc mơ cuối cùng của mọi người dùng nâng cao, nhiều chức năng
- Nhà phát triển cho biết, dự án chủ yếu do anh ấy tự viết trong VSCode, thỉnh thoảng sử dụng AI/LLM để dịch các chuỗi ký tự tiếng Trung
- Có người đề xuất rằng công cụ này có thể chạy sau CGNAT và tích hợp với Google Drive, Mega Dropbox, GitHub, v.v.
- Có người đề cập rằng công cụ này là một công cụ tuyệt vời, sẽ có trải nghiệm sâu sắc hơn sau khi xem video demo
- Có người hỏi liệu có thể xây dựng một ứng dụng tương tự dựa trên giao thức Syncthing hay không
- Có người cho rằng Copyparty là một phần mềm tuyệt vời và khuyên nên xem video trên YouTube
- Có người nói rằng phần mềm này khiến họ muốn tìm một trường hợp sử dụng cho nó
- Có người muốn tạo một “thư viện” chạy bằng năng lượng mặt trời để chia sẻ nội dung kỹ thuật số
- Có người lo lắng rằng việc tạo nội dung chia sẻ trong phạm vi Wi-Fi của trường có thể khiến ai đó tải lên nội dung có hại, vì vậy đã không thực hiện
- Có người đã từng tạo một PirateBox để chia sẻ nội dung thuộc phạm vi công cộng, nhưng không tiếp tục
Giải thích về LLM Embeddings: Hướng dẫn Trực quan và Dễ hiểu #
LLM Embeddings Explained: A Visual and Intuitive Guide
https://huggingface.co/spaces/hesamation/primer-llm-embedding
Trang web này là một không gian do Hugging Face cung cấp, có tiêu đề là “LLM Embeddings Explained: A Visual and Intuitive Guide” (Giải thích về LLM Embeddings: Hướng dẫn trực quan và dễ hiểu), được tạo bởi người dùng hesamation. Ứng dụng này được thiết kế để giải thích cách các mô hình ngôn ngữ chuyển đổi văn bản thành các biểu diễn có ý nghĩa, tức là các embedding.
Nội dung được tóm tắt như sau:
- Khái niệm về embedding: Trang web trình bày chi tiết các khái niệm cơ bản về embedding, giải thích cách chúng chuyển đổi văn bản thành biểu diễn số, để máy tính có thể hiểu và xử lý ngôn ngữ.
- Mô hình ngôn ngữ truyền thống và hiện đại: Nội dung đề cập đến sự khác biệt giữa các mô hình ngôn ngữ truyền thống và các mô hình học sâu hiện đại (chẳng hạn như BERT, GPT, v.v.) trong việc tạo ra các embedding, cho thấy sự phát triển và tiến bộ của công nghệ.
- Ví dụ trực quan: Để giúp người dùng hiểu rõ hơn, trang web cung cấp nhiều ví dụ trực quan, trình bày cách thức hoạt động của embedding. Các công cụ hỗ trợ trực quan này giúp người dùng thấy trực quan cách các văn bản khác nhau được chuyển đổi thành các vectơ embedding tương ứng.
- Các tình huống ứng dụng: Trang web cũng khám phá tầm quan trọng của embedding trong các ứng dụng thực tế, chẳng hạn như trong các tác vụ xử lý ngôn ngữ tự nhiên (NLP), bao gồm phân loại văn bản, phân tích tình cảm và hệ thống hỏi đáp, v.v.
- Tính tương tác: Người dùng có thể tương tác thông qua ứng dụng này, nhập văn bản và quan sát các embedding được tạo ra, để hiểu sâu hơn.
Nói chung, trang web này là một tài nguyên giáo dục về embedding của mô hình ngôn ngữ, được thiết kế để giúp người dùng hiểu chủ đề kỹ thuật phức tạp này thông qua một cách trực quan và dễ hiểu.
HN | Độ nóng: 401 điểm | 77 bình luận | Tác giả: eric-burel #
https://news.ycombinator.com/item?id=44708028
- Lớp nhúng (embedding layer) được bao gồm trong mô hình trong quá trình lan truyền ngược (backpropagation) thông thường, nhưng không phải thông qua mã hóa one-hot, vì làm như vậy rất kém hiệu quả.
- Lập chỉ mục và nhân với nhúng one-hot là tương đương, nhưng sử dụng lập chỉ mục hiệu quả hơn.
- Lớp nhúng có ảnh hưởng lớn đến khả năng suy luận các kết nối ngữ nghĩa của mô hình, nhưng ít được thảo luận.
- Lớp nhúng rất khó giải thích đối với chính mô hình, quá trình học tập nén nó lại đến mức chỉ có phần đầu giải mã (decoder head) của mô hình biết cách xử lý.
- Việc thêm nhúng vị trí xoay (rotary positional embeddings) đặc trưng của LLM khiến khái niệm trở nên phức tạp hơn và khó giải thích cho những người làm kỹ thuật.
- “Không có nhúng vị trí” có thể phù hợp hơn với ngữ cảnh dài hạn, vì vậy có thể không phải là một khái niệm cần phải giải thích.
- Lớp nhúng chứa thông tin trừu tượng hơn so với các đối tượng có thể giải thích được hoặc tương đương về mặt thống kê của con người, ngay cả khi có nhiều thông tin hơn, con người cũng khó tiếp cận hơn.
- Sử dụng phân cụm quang phổ đa lớp (multi-class spectral clustering) để truy vấn không gian nhúng có thể mang lại kết quả tốt.
- Phần đầu giải mã được học (learned decoder head) là một thuật ngữ thú vị, có thể là thuật ngữ chuyên môn hoặc phép loại suy cá nhân.
- Tất cả các lớp học sâu (deep learning layers) đều tương đối mới, nhưng không có nhiều cuộc thảo luận về mức độ điên rồ của chúng, đặc biệt là khi chúng là những ngôi sao thực sự trong LLM.
- Có thể tìm kiếm từ hoặc biểu thức phù hợp nhất trong từ điển, rất dễ hiểu nhúng trỏ đến đâu.
- Có thể thực hiện các thao tác như vậy ở giữa các lớp, nhưng làm như vậy có thể không có nhiều ý nghĩa đối với ý nghĩa của từ đầu ra cuối cùng.
- Có thể giải mã nhúng để gỡ lỗi, nhưng đây là một quá trình mất mát (vì nó làm mất ngữ cảnh) và không thể đảo ngược.
- Hầu hết các giá trị trong không gian nhiều chiều đều trực giao và cách xa nhau, nhưng vẫn có thể sử dụng các kỹ thuật giảm chiều để phân cụm các khái niệm.
- Các điểm trong không gian nhúng không được phân phối đồng đều, toàn bộ tác dụng của mô hình là chiếu các kết quả này lên một tập hợp con “có ý nghĩa” đối với vấn đề.
- Độ tương đồng cosine (Cosine similarity) là bạn tốt của bạn.
- Độ tương đồng cosine là tích vô hướng sau khi các vectơ được chuẩn hóa thành hình cầu đơn vị, việc chuẩn hóa không thay đổi tính trực giao và cũng không thay đổi thực tế là hầu hết các vectơ nhiều chiều đều (gần như) trực giao.
Debian chuyển sang thời gian 64-bit cho mọi thứ #
Debian switches to 64-bit time for everything
https://www.theregister.com/2025/07/25/y2k38_bug_debian/
Bài viết này thảo luận về cách bản phân phối Debian Linux ứng phó với Unix Epochalypse sắp tới (còn được gọi là vấn đề Y2K38). Debian có kế hoạch giải quyết vấn đề này bằng cách chuyển sang thời gian 64-bit trong bản phát hành Debian 13 “Trixie" sắp tới, điều này sẽ ảnh hưởng đến tất cả phần cứng được hỗ trợ, ngoại trừ phần cứng cũ nhất.
Vấn đề Unix Epochalypse bắt nguồn từ cách tính thời gian hệ thống Unix, tức là số giây đã trôi qua kể từ ngày 1 tháng 1 năm 1970. Đến ngày 19 tháng 1 năm 2038 03:14:07 UTC, số giây đã trôi qua sẽ vượt quá phạm vi mà một số nguyên 32-bit có dấu có thể biểu diễn. Điều này là do quyết định sử dụng số nguyên 32-bit để lưu trữ số giây nhiều năm trước. Tương tự như vấn đề Y2K, các nhà phát triển phần mềm đã bắt đầu giải quyết vấn đề này. Đối với phần mềm chạy trên phần cứng 64-bit, vấn đề này đã được giải quyết, nhưng Debian, với vai trò là lựa chọn hệ điều hành cho các thiết bị nhúng cũ và hạn chế về tài nguyên trên bộ xử lý 32-bit, cần phải hành động.
Các nhà phát triển Debian chỉ ra rằng vẫn còn rất nhiều thiết bị tính toán 32-bit nhạy cảm về chi phí đang được sử dụng, bao gồm ô tô, thiết bị IoT, TV, bộ định tuyến, điều khiển nhà máy, giám sát/điều khiển tòa nhà và điện thoại Android giá rẻ, v.v. Hầu hết phần cứng mới này sẽ chạy các hệ điều hành được xây dựng từ mã nguồn như OpenEmbedded, Alpine, Android hoặc Gentoo, nhưng thị phần dựa trên Debian có thể tiếp tục trong một thời gian và một số thiết bị sử dụng nó có thể được sử dụng đủ lâu để vẫn còn được sử dụng trước tháng 1 năm 2038.
Để giải quyết vấn đề này, Debian đã quyết định thay đổi biến time_t trên phần cứng 32-bit thành số nguyên 64-bit. Đây là một thay đổi lớn, vì những người bảo trì Debian phát hiện ra rằng biến time_t “ở khắp mọi nơi” trong 6.429 gói phần mềm. Do thay đổi này yêu cầu các thay đổi phá vỡ giao diện nhị phân ứng dụng (ABI) đồng thời cho tất cả các thư viện bị ảnh hưởng, khối lượng công việc là khá lớn. Mặc dù vậy, Debian tin rằng công việc này đã hoàn thành và được kiểm tra đầy đủ để có thể thực hiện các thay đổi sau khi Debian 13 “Trixie" được phát hành, ít nhất là đối với hầu hết phần cứng.
Bài viết kết luận rằng cổng i386 sẽ giữ lại time_t 32-bit hiện có, như một kiến trúc tương thích cho các tệp nhị phân x86 hiện có. Nếu có đủ sự nhiệt tình để đưa x86 32-bit vào tương lai rất hạn chế hiện tại của nó, có thể tạo một ABI/kiến trúc x86 ‘i686’ mới sử dụng thời gian 64-bit và có thể sử dụng các tính năng ISA mới hơn. Cổng hurd-i386 sẽ không chuyển đổi, vì kernel của nó thiếu hỗ trợ, thay vào đó, nó đang nỗ lực chuyển sang hurd-amd64. Thông tin thêm về cách kiểm tra xem việc chuyển đổi thời gian 64-bit có làm hỏng phần mềm hay không có thể được tìm thấy trên Debian wiki.
HN | Độ nóng: 367 điểm | 240 bình luận | Tác giả: pseudolus #
https://news.ycombinator.com/item?id=44709408
- Steve Langasek đã dành những năm cuối đời để giải quyết vấn đề thời gian 64-bit, có đóng góp quan trọng cho sự tiến bộ, ông sẽ được tưởng nhớ.
- Trong một số hệ thống hoặc mục đích sử dụng, việc tiết kiệm 2 byte vào một số thời điểm là rất tốn kém.
- Phần mềm cập nhật và thay đổi nhanh chóng, phần mềm từ những năm 70/80/90 không được dự kiến sẽ được sử dụng đến năm 2000.
- Cho đến nay, vẫn còn sử dụng năm có hai chữ số, ví dụ như ngày hết hạn của thẻ tín dụng.
- Vấn đề Y2K không chỉ vì tiết kiệm byte, mà còn bao gồm các vấn đề về UI, chẳng hạn như trường văn bản chỉ có 2 ký tự và mã hóa cứng +1900.
- Có diễn đàn nhảy từ năm 1999 sang năm 19100, hiển thị lỗi nhưng không phải là vấn đề nghiêm trọng.
- Khi biểu thị ngày tháng, sử dụng giá trị số nguyên đơn giản bắt đầu từ năm 1900 có thể tiết kiệm nhiều byte hơn.
- Người sinh năm 1899 vẫn còn sống vào năm 1970, vì vậy không thể sử dụng hệ thống để lưu trữ ngày sinh của họ.
- Điều chỉnh phạm vi, sử dụng 3 byte và bù 2 có thể biểu thị từ năm 20000 trước Công nguyên đến năm 22000 sau Công nguyên.
- Hệ thống sử dụng ký tự (số thập phân ASCII) hoặc số mã hóa BCD, thay vì hệ thống mã hóa số nguyên, do đó có thời hạn 1999.
- Nhiều hệ thống cũ không sử dụng byte/số nguyên trong C để lưu trữ số, mà sử dụng BCD hoặc định dạng văn bản.
- Tác giả ngôn ngữ COBOL có thể thêm kiểu dữ liệu ngày tháng vào COBOL.
- COBOL hỗ trợ số có bốn chữ số.
- COBOL sử dụng định dạng ký tự có độ rộng cố định, cần phải mã hóa cứng kích thước trường trong tất cả các phần.
- Có người đã mua một lượng lớn quyền chọn bán trước Y2K, cho rằng cổ phiếu ngân hàng sẽ sụp đổ, nhưng tác động thực tế không đáng kể.
- Để ngăn chặn vấn đề xảy ra, đã có rất nhiều công việc được thực hiện.
- Các ngân hàng đã bắt đầu xử lý vấn đề Y2K từ năm 1991, tiêu tốn rất nhiều thời gian và ngân sách.
- Mọi người dự đoán máy bay sẽ rơi vào ngày 1 tháng 1 năm 2000 lúc 00:00, nhưng thực tế không có chuyện đó xảy ra.
- Mọi người nhận thấy rằng khi mọi thứ không xảy ra như dự đoán, người ta sẽ cho rằng “không có gì xảy ra cả”.
- Hệ thống Linux và Unix sử dụng bộ đếm thời gian 32-bit, không có vấn đề Y2K, nhưng một số ứng dụng có thể gặp vấn đề này.
Tao về LLM “đội xanh” so với “đội đỏ” #
Tao on “blue team” vs. “red team” LLMs
https://mathstodon.xyz/@tao/114915604830689046
Trang web này thảo luận về các khái niệm “Đội Xanh” và “Đội Đỏ” trong an ninh mạng, và cách các khái niệm này mở rộng sang các lĩnh vực khác, chẳng hạn như kỹ thuật phần mềm và toán học.
Trong lĩnh vực an ninh mạng, có sự phân biệt giữa các nhiệm vụ của “Đội Xanh” và “Đội Đỏ”. Đội Xanh chịu trách nhiệm xây dựng các hệ thống an toàn, trong khi Đội Đỏ chịu trách nhiệm tìm ra các lỗ hổng trong các hệ thống đó. Đội Xanh rõ ràng cần thiết hơn để tạo ra sản phẩm mong muốn; nhưng Đội Đỏ cũng quan trọng không kém do những thiệt hại có thể xảy ra do triển khai một hệ thống không an toàn. Bản chất của các đội này phản ánh lẫn nhau, các nhà toán học có thể gọi chúng là “đối ngẫu”.
Đầu ra của Đội Xanh chỉ mạnh bằng mắt xích yếu nhất của nó: một hệ thống an toàn bao gồm các thành phần mạnh và yếu (ví dụ: một ngôi nhà có cửa khóa an toàn nhưng cửa sổ mở) sẽ không an toàn (thực tế còn tệ hơn, vì các thành phần mạnh có thể truyền tải cảm giác an toàn sai lệch). Ngược lại, đóng góp của Đội Đỏ thường mang tính tích lũy: một báo cáo của Đội Đỏ bao gồm các lỗ hổng nghiêm trọng và các vấn đề nhỏ nhặt hữu ích hơn một báo cáo chỉ bao gồm các vấn đề nghiêm trọng, vì việc Đội Xanh giải quyết cả hai lỗ hổng đều có giá trị. (Nhưng quá nhiều báo cáo chất lượng thấp có thể làm phân tán sự chú ý khỏi các vấn đề quan trọng.) Do đó, những người đóng góp không đáng tin cậy có thể hữu ích hơn ở khía cạnh “Đội Đỏ” của một dự án so với khía cạnh “Đội Xanh”, miễn là Đội Xanh có thể chấp nhận những người đóng góp như vậy, với điều kiện Đội Đỏ đủ khả năng nắm bắt và sửa chữa hầu hết mọi lỗi mà các thành viên Đội Xanh có thể mắc phải.
Đóng góp không đáng tin cậy của Đội Đỏ chỉ có giá trị khi chúng tăng cường đầu ra của các thành viên đội đáng tin cậy hơn, thay vì thay thế đầu ra đó, và khi đầu ra của chúng có thể được lọc hoặc phân loại hiệu quả bởi các thành viên Đội Đỏ có kinh nghiệm hơn.
Trang web cũng đề cập rằng sự phân biệt Đội Xanh/Đội Đỏ này không chỉ giới hạn trong an ninh mạng mà còn mở rộng sang nhiều lĩnh vực khác. Ví dụ, trong kỹ thuật phần mềm, “Đội Xanh” có thể tương ứng với việc tạo ra mã máy tính mới, trong khi “Đội Đỏ” bao gồm việc đảm bảo chất lượng và kiểm tra các mã đó. Trong toán học, “Đội Xanh” có thể liên quan đến việc đưa ra các ý tưởng suy đoán để giải quyết các bài toán toán học, trong khi “Đội Đỏ” kiểm tra các lỗi hình thức trong các lập luận và đưa ra các phản đối heuristic về tính khả thi của phương pháp Đội Xanh.
Tác giả cũng đề cập rằng ông thích gọi hai đội này trong toán học là “người lạc quan” và “người bi quan”; theo kinh nghiệm của ông, sự hợp tác mạnh mẽ nhất xảy ra khi có số lượng người lạc quan và bi quan gần bằng nhau trong sự hợp tác.
Nhiều trường hợp sử dụng công cụ AI được đề xuất cố gắng phân loại các công cụ này là “Đội Xanh”, chẳng hạn như tạo mã, văn bản, hình ảnh hoặc lập luận toán học theo cách bán tự động hoặc tự động, các công cụ này được thiết kế để sử dụng cho một số ứng dụng bên ngoài. Tuy nhiên, do tính không đáng tin cậy và không minh bạch của các công cụ này, có lẽ tốt hơn là sử dụng chúng cho “Đội Đỏ”, để phê bình đầu ra của các chuyên gia con người của Đội Xanh, thay vì trực tiếp thay thế đầu ra đó; chỉ nên cho phép sử dụng AI “Đội Xanh” khi “Đội Đỏ” có thể nắm bắt và sửa chữa bất kỳ lỗi nào do AI “Đội Xanh” tạo ra.
Phương pháp này không chỉ tận dụng các điểm mạnh hiện tại của AI, chẳng hạn như khả năng tiếp xúc rộng rãi và phản hồi nhanh chóng, mà còn giảm thiểu rủi ro khi triển khai đầu ra AI chưa được xác minh trong môi trường rủi ro cao. Tác giả nhận thấy trong các thử nghiệm cá nhân rằng AI rất hữu ích trong việc cung cấp phản hồi bổ sung về một số văn bản, lập luận, mã hoặc slide được đề xuất mà ông tạo ra (bao gồm cả văn bản hiện tại). Ông có thể chỉ đồng ý với một phần nhỏ các đề xuất do công cụ AI tạo ra; nhưng ông thấy rằng vẫn có một số nhận xét hữu ích mà ông đồng ý và đưa vào đầu ra của mình.
Đây là một trường hợp sử dụng AI rõ ràng ít hào nhoáng hoặc trực quan hơn, so với tự động hóa trực tiếp đầu ra của chính mình theo kiểu “Đội Xanh” phổ biến hơn, nhưng tác giả nhận thấy nó mang lại giá trị đáng tin cậy hơn.
HN | Độ nóng: 363 điểm | 129 bình luận | Tác giả: qsort #
https://news.ycombinator.com/item?id=44711306
- AI hữu ích trong cả “đội đỏ” và “đội xanh”, đội xanh chủ yếu là động não.
- AlphaEvolve là một ví dụ rõ ràng về phương pháp “đội đỏ/đội xanh”, mặc dù họ không sử dụng các thuật ngữ này.
- Điều này gợi nhớ đến sự phân công “người xác minh/người bác bỏ” trong ngữ nghĩa trò chơi.
- Hệ thống an ninh không chỉ phụ thuộc vào mắt xích yếu nhất của nó, mà còn phụ thuộc vào việc có các lớp an ninh hoặc các yếu tố song song hay không.
- Kiểm thử thường có chi phí thấp, nếu sai có thể dễ dàng loại bỏ hoặc sửa đổi, nếu đúng thì tăng thêm giá trị.
- Việc để LLM sửa lỗi hoặc thêm chức năng phức tạp hơn, vì chúng có thể gian lận hoặc viết mã không ổn định.
- Trong các codebase kế thừa, kiểm thử là nguồn gốc của sự thật, quan trọng hơn cả code, kiểm thử sai còn có hại hơn code sai.
- Bộ kiểm thử lớn, toàn diện và dễ bị tổn thương sẽ làm giảm đáng kể tốc độ của nhà phát triển.
- Những kiểm thử này rất có giá trị để đảm bảo tuân thủ các tiêu chuẩn như quy trình OAuth2.
- Các bug tồn tại lâu dài có thể trở thành một phần của API mà khách hàng phụ thuộc vào.
- Kiểm thử do AI tạo ra có thể làm tăng ảo giác về năng suất.
- AI giúp hoàn thành nhanh chóng các nhiệm vụ quan liêu vô ích, nhưng tốc độ tạo ra các nhiệm vụ quan liêu có thể vượt quá tốc độ tự động hóa của AI.
- Việc hoài nghi về các công cụ mới là phù hợp, nên chỉ ra các mô hình thất bại.
- Nếu kiểm thử do AI tạo ra chỉ liên quan đến dữ liệu giả và stub không thực sự thực hiện logic, thì cần có kiến thức chuyên môn để xác định và sửa chữa.
Tôi đã hack máy giặt của mình #
I hacked my washing machine
https://nexy.blog/2025/07/27/how-i-hacked-my-washing-machine/
Bài viết này được Nex đăng trên blog của anh ấy, kể về việc anh ấy đã “hack” chiếc máy giặt của mình như thế nào. Dưới đây là bản tóm tắt tiếng Việt của bài viết:
Giới thiệu bối cảnh: Nex gần đây đã chuyển đến một ngôi nhà mới, ngôi nhà được trang bị một chiếc máy giặt “thông minh” có kết nối Wi-Fi và điều khiển bằng ứng dụng di động. Vì trong nhà có một vài sinh viên an ninh mạng, ban đầu họ nghi ngờ về việc kết nối máy giặt với mạng, nhưng cuối cùng vẫn làm như vậy. Máy giặt có một chức năng là gửi thông báo đến ứng dụng di động khi chu trình giặt kết thúc, điều này rất hữu ích cho Nex, người thường quên lấy quần áo ra. Câu chuyện về chuông cửa: Bài viết cũng đề cập đến vấn đề chuông cửa của ngôi nhà. Vì ngôi nhà là một tòa nhà kiểu Victoria cổ kính, tường, sàn và cửa đều rất dày, khiến âm thanh chuông cửa khó nghe. May mắn thay, chuông cửa có một bộ thu có thể cắm ở những nơi khác, khi chuông cửa được nhấn, nó sẽ gửi tín hiệu đến bộ thu. Bạn của Nex đã mua một bộ thu giá rẻ, khi nhận được tín hiệu, nó sẽ gửi thông báo trên máy chủ Discord của họ. Sau thành công của dự án này, họ đã nghĩ đến việc liệu có thể làm điều tương tự với máy giặt hay không. Kế hoạch: Nex có một số kinh nghiệm về kỹ thuật đảo ngược và hack ứng dụng di động, anh ấy dự định tìm hiểu API bằng cách xem máy giặt ứng dụng kết nối với máy chủ nào. Anh ấy đã sử dụng một router tương thích OpenWRT, thiết lập SSID tạm thời và để máy giặt kết nối với nó. Sau đó, anh ấy bắt đầu sử dụng tcpdump để bắt các gói tin. Giao tiếp của máy giặt: Sau khi theo dõi lưu lượng, Nex đã phát hiện ra bốn điều:
- Máy giặt dường như rất thích giao tiếp với chính nó, có thể là do các kỹ sư mạng không hiểu về giao diện loopback.
- Máy giặt gửi lưu lượng đến 255.255.255.255 mỗi giây một lần.
- Máy giặt thỉnh thoảng liên hệ với một máy chủ có tên simplyfimgmt.candy-hoover.com, máy chủ này là một CNAME đến tên miền Heroku DNS.
- Máy giặt giao tiếp trực tiếp với ứng dụng di động, ứng dụng gửi các yêu cầu HTTP đến cổng 80.
Trong những phát hiện này, chỉ có điểm cuối cùng là đặc biệt thú vị, vì vậy Nex bắt đầu nghiên cứu sâu hơn.
Bài viết kết thúc ở đây, không cung cấp thêm chi tiết, chẳng hạn như họ có thành công trong việc kỹ thuật đảo ngược API của máy giặt hay không, hoặc họ có thể thực hiện mục tiêu nhận thông báo máy giặt trên Discord hay không. Bài viết này chủ yếu nói về cách Nex và bạn bè của anh ấy bắt đầu dự án này và những gì họ đã khám phá ra trong quá trình khám phá ban đầu.
HN | Độ nóng: 348 điểm | 153 bình luận | Tác giả: JadedBlueEyes #
https://news.ycombinator.com/item?id=44704270
- Sử dụng apk-mitm có thể loại bỏ vấn đề ghim chứng chỉ trong ứng dụng Android và ghi đè tệp kê khai để tin tưởng chứng chỉ do người dùng cài đặt, không cần root thiết bị.
- Công cụ jadx có thể chuyển đổi APK thành mã gần giống Java, giúp tìm khóa giải mã.
- Nếu ứng dụng cung cấp dữ liệu đã mã hóa cho ứng dụng và hiển thị dữ liệu đã giải mã, thì ứng dụng phải chứa khóa giải mã hoặc tải khóa xuống từ đâu đó.
- Ngay cả khi chưa ai làm công việc tương tự, bạn cũng nên cố gắng hiểu cách mã hoạt động trên thiết bị, ngay cả khi cuối cùng không thành công, bạn vẫn có thể học được rất nhiều.
- Một người dùng đã giải quyết vấn đề ứng dụng trở nên tệ hơn sau khi cập nhật bằng cách tắt tự động cập nhật và quay lại phiên bản cũ, đồng thời tiếp tục sử dụng ứng dụng thông qua việc bỏ qua ghim chứng chỉ.
- Một người dùng khác đã sử dụng Bosch API và Home Assistant để tạo tập lệnh nhắc nhở khi máy giặt hoàn thành chu trình giặt và kiểm tra xem cửa có mở không.
- Có người đề cập đến việc sử dụng ổ cắm thông minh để tích hợp trạng thái của máy giặt “ngu ngốc” vào Home Assistant, bằng cách phát hiện các kiểu tiêu thụ điện năng để xác định trạng thái của chu trình giặt.
- Có người gợi ý sử dụng ESP32 và cảm biến rung để phát hiện xem máy sấy quần áo có đang chạy hay không, vì hầu hết các máy sấy quần áo không có chu trình, vì vậy rất dễ phát hiện trạng thái hoạt động của chúng.
- Có người đề cập đến việc sử dụng bộ phát LoRa để truyền thông tin trạng thái của máy giặt “ngu ngốc” đến mạng gia đình, mặc dù máy giặt nằm ở tầng hầm của căn hộ, cách xa.
- Có người đề xuất có thể phát hiện dòng điện chạy qua bằng cách quấn dây quanh dây nguồn của máy sấy quần áo và kết nối nó với Arduino hoặc Raspberry Pi.