Bộ lọc spam email hoạt động thế nào? Cách vượt qua bộ lọc spam hiệu quả
Mỗi ngày, hơn 45% tổng số email toàn cầu là thư rác — tương đương hàng trăm tỷ tin nhắn không mong muốn. Để người dùng không bị nhấn chìm, các hệ thống email hiện đại triển khai nhiều lớp bộ lọc spam tinh vi, từ kiểm tra danh sách đen đến mô hình học máy phân tích ngữ nghĩa theo thời gian thực.
Hiểu rõ cơ chế hoạt động của bộ lọc spam không chỉ giúp bạn bảo vệ hộp thư đến, mà còn giúp các marketer, doanh nghiệp gửi email đúng cách để thư hợp lệ không bị chặn nhầm. Bài viết này phân tích chi tiết các phương pháp lọc spam phổ biến, danh sách từ ngữ kích hoạt bộ lọc và hướng dẫn thực tế để email của bạn đến đúng inbox.
Contents
Tổng quan về bộ lọc spam email

Bộ lọc spam là gì?
Bộ lọc spam email (spam filter) là một hệ thống phần mềm tự động phân tích và phân loại email đến, xác định xem thư có phải là spam hay không trước khi nó hiển thị trong hộp thư đến của người nhận.
Bộ lọc hoạt động bằng cách đánh giá email trên nhiều tiêu chí: thông tin người gửi, tiêu đề, nội dung, cấu trúc HTML, liên kết bên trong và hành vi gửi trong quá khứ. Mỗi tiêu chí được gán một điểm số rủi ro. Nếu tổng điểm vượt ngưỡng cho phép, email bị chuyển vào thư mục spam hoặc bị chặn hoàn toàn.
Có hai loại lọc chính:
- Lọc phía máy chủ (server-side): Được áp dụng trước khi email đến hộp thư người dùng. Phổ biến nhất, được vận hành bởi nhà cung cấp dịch vụ email.
- Lọc phía máy khách (client-side): Chạy trực tiếp trong ứng dụng email (Outlook, Thunderbird) để phân loại thêm sau khi thư đã được nhận.
Ai tạo ra và vận hành bộ lọc spam?
Bộ lọc spam được vận hành bởi nhiều bên khác nhau:
Nhà cung cấp dịch vụ email lớn như Google (Gmail), Microsoft (Outlook/Hotmail), Yahoo Mail tự phát triển hệ thống lọc riêng. Gmail sử dụng mô hình AI được huấn luyện trên hàng tỷ email, đạt tỷ lệ chặn spam trên 99,9%.
Nhà cung cấp email doanh nghiệp như Proofpoint, Mimecast, Barracuda cung cấp giải pháp lọc chuyên biệt cho tổ chức, tích hợp nhiều lớp bảo vệ bổ sung.
Các tổ chức phi lợi nhuận và cộng đồng mã nguồn mở phát triển công cụ như SpamAssassin (Apache Foundation), Spamhaus (duy trì danh sách đen), và SURBL (danh sách URL spam).
Nhà cung cấp dịch vụ email tại Việt Nam như iNET tích hợp các hệ thống lọc đa lớp, kết hợp danh sách đen toàn cầu với bộ lọc nội dung được tùy chỉnh phù hợp ngữ cảnh tiếng Việt.
Các phương pháp lọc spam phổ biến

1- Lọc dựa trên nội dung (Content-based filtering)
Đây là phương pháp lọc cơ bản nhất và vẫn được sử dụng rộng rãi như một trong những lớp đầu tiên của hệ thống bảo vệ.
Bộ lọc nội dung quét toàn bộ văn bản của email — từ dòng tiêu đề, tên người gửi, đến phần thân và chữ ký — tìm kiếm các từ khóa, cụm từ hoặc mẫu ngôn ngữ thường xuất hiện trong thư rác. Một số quy tắc điển hình:
- Tiêu đề chứa nhiều dấu chấm than (!!!) hoặc dấu hỏi (??)
- Văn bản viết hoa toàn bộ (“MUA NGAY ĐỂ NHẬN QUÀ TẶNG MIỄN PHÍ”)
- Tỷ lệ từ khóa spam trên tổng nội dung vượt ngưỡng
- HTML sử dụng màu trắng để ẩn văn bản (white text trick)
- Ký tự đặc biệt thay thế chữ cái thông thường (“Fr€e”, “m0ney”)
Nhược điểm của phương pháp này là tỷ lệ dương tính giả (false positive) còn cao — email hợp lệ nói về chủ đề tài chính hoặc khuyến mãi có thể bị nhận nhầm là spam.
2- Lọc Bayesian (Naive Bayes classifier)
Lọc Bayesian, hay còn gọi là lọc đoán spam email bằng Naive Bayes, là một trong những bước tiến quan trọng nhất trong lịch sử chống spam, được Paul Graham đề xuất năm 2002 qua bài viết “A Plan for Spam”.
Nguyên lý hoạt động:
Dựa trên định lý Bayes trong xác suất thống kê, bộ lọc tính toán xác suất một email là spam dựa trên tần suất xuất hiện của từng từ trong các email đã biết là spam so với email hợp lệ.
Bộ lọc spam hoạt động dựa trên Định lý Bayes trong xác suất thống kê. Hiểu đơn giản, hệ thống sẽ “học” từ dữ liệu email trong quá khứ để tính toán khả năng một email mới là spam hay không.
Cụ thể, bộ lọc sẽ phân tích từng từ xuất hiện trong email, sau đó so sánh tần suất xuất hiện của những từ này trong hai nhóm:
- Email đã được xác định là spam
- Email hợp lệ (không phải spam)
Từ đó, hệ thống ước tính xác suất email thuộc loại spam dựa trên các từ mà nó chứa.
Công thức cơ bản:
Trong đó:
- P(từ/spam): Xác suất từ đó xuất hiện trong email spam
- P(spam): Xác suất chung của một email là spam
- P(từ): Xác suất từ đó xuất hiện trong tất cả email
Ví dụ thực tế:
Giả sử từ “casino” xuất hiện trong 80% email spam nhưng chỉ xuất hiện trong 0,5% email thông thường. Khi một email chứa từ này, bộ lọc sẽ coi đây là một tín hiệu mạnh và tăng đáng kể khả năng phân loại email đó là spam.
Nhờ cơ chế “học từ dữ liệu”, bộ lọc Bayes ngày càng chính xác hơn theo thời gian, đặc biệt khi được cập nhật liên tục với các mẫu email mới.
Ưu điểm của bộ lọc Naive Bayes
- Tự học (Adaptive):
Bộ lọc có khả năng “học” từ hành vi của người dùng. Mỗi khi bạn đánh dấu một email là spam hoặc không phải spam, hệ thống sẽ ghi nhớ và điều chỉnh lại cách đánh giá trong tương lai. Nhờ đó, độ chính xác ngày càng được cải thiện theo thời gian. - Tốc độ xử lý cao:
Do cách tính toán đơn giản, bộ lọc có thể xử lý rất nhanh — thậm chí hàng nghìn email mỗi giây. Điều này đặc biệt quan trọng với các hệ thống email lớn. - Cá nhân hóa:
Mỗi người dùng có thể có một “bộ lọc riêng”. Ví dụ, email chứa từ “marketing” có thể là bình thường với bạn nhưng lại là spam với người khác. Bộ lọc sẽ dần thích nghi để phản ánh đúng thói quen và ngữ cảnh giao tiếp của từng người.
Nhược điểm của bộ lọc Naive Bayes
- Giả định “ngây thơ” (Naive):
Bộ lọc giả định rằng các từ trong email là độc lập với nhau. Trong thực tế, ngữ nghĩa của câu thường phụ thuộc vào sự kết hợp giữa các từ, nên việc bỏ qua ngữ cảnh có thể dẫn đến đánh giá chưa chính xác. - Dễ bị “đánh lừa”:
Kẻ gửi spam có thể chèn thêm các từ ngẫu nhiên hoặc nội dung không liên quan vào email để làm “nhiễu” hệ thống. Điều này khiến xác suất bị phân loại là spam giảm đi, dù bản chất email vẫn là spam.
>> Đọc thêm hướng dẫn thực hành sử dụng bộ lọc SpamAssassin Bayesian để cấu hình bộ lọc Bayesian trên server.
3- Lọc dựa trên danh sách đen/trắng (Blacklist/Whitelist)
Danh sách đen (Blacklist/Blocklist): Tập hợp các địa chỉ IP, tên miền hoặc địa chỉ email đã được xác nhận là nguồn spam. Email từ các địa chỉ này bị chặn tự động.
Các tổ chức duy trì danh sách đen uy tín gồm có:
- Spamhaus: Cơ sở dữ liệu lớn nhất, bao gồm SBL (Spamhaus Block List), XBL (Exploits Block List), và PBL (Policy Block List).
- SURBL: Tập trung vào URL xuất hiện trong email spam.
- Barracuda Reputation Block List (BRBL): Cập nhật theo thời gian thực.
Danh sách trắng (Whitelist): Danh sách địa chỉ tin cậy luôn được phép vào inbox, bỏ qua tất cả bộ lọc khác. Thường được áp dụng với đối tác kinh doanh, nhà cung cấp dịch vụ đã xác minh.
Danh sách xám (Greylist): Phương pháp trung gian — máy chủ nhận tạm thời từ chối email từ người gửi chưa biết và yêu cầu gửi lại sau vài phút. Máy chủ gửi hợp lệ luôn thực hiện lại, trong khi phần mềm spam thường không thử lại.
>> Tìm hiểu cách kiểm tra hạ tầng bảo mật email server để đánh giá blacklist status.
4- Lọc dựa trên header email
Header (phần đầu) của một email chứa nhiều thông tin kỹ thuật mà người dùng thường không nhìn thấy nhưng bộ lọc spam phân tích rất kỹ.
Các yếu tố header được kiểm tra:
- SPF (Sender Policy Framework): Xác minh địa chỉ IP gửi có nằm trong danh sách được phép của tên miền không. Email gửi từ IP không được ủy quyền bị đánh dấu đáng ngờ.
- DKIM (DomainKeys Identified Mail): Chữ ký số xác nhận email không bị chỉnh sửa trong quá trình truyền tải và đúng là do chủ sở hữu tên miền gửi. (Cấu hình đúng bản ghi DMARC giúp email vượt qua lớp lọc header này.)
- DMARC (Domain-based Message Authentication): Quy định chính sách xử lý email không vượt qua kiểm tra SPF và DKIM (từ chối, cách ly hoặc không làm gì).
- Return-Path: Địa chỉ nhận thông báo lỗi; nếu khác với địa chỉ “From:” là dấu hiệu đáng ngờ.
- Received chain: Danh sách các máy chủ mà email đi qua; đường đi bất thường hoặc quá dài có thể là dấu hiệu spam.
Email không thiết lập SPF/DKIM/DMARC đúng cách có nguy cơ cao bị lọc vào spam, kể cả khi nội dung hoàn toàn hợp lệ.
5- Lọc bằng AI và Machine Learning
Các hệ thống email hiện đại ứng dụng học máy (machine learning) và học sâu (deep learning) để vượt qua giới hạn của các phương pháp truyền thống.
Mô hình phân tích ngữ nghĩa (NLP): Thay vì đếm từ đơn lẻ, AI hiểu ý nghĩa của toàn bộ câu và đoạn văn. Một email không chứa từ “casino” nhưng mô tả “cơ hội đầu tư với lợi nhuận đảm bảo không rủi ro” vẫn có thể bị nhận diện chính xác là spam.
Phân tích hành vi gửi: AI theo dõi mẫu hành vi của người gửi theo thời gian — tần suất gửi, tỷ lệ mở, tỷ lệ báo cáo spam, danh sách người nhận. Người gửi đột ngột gửi hàng nghìn email mỗi giờ sẽ bị đánh dấu.
Phân tích hình ảnh: Một số spam hiện đại chứa nội dung chính trong hình ảnh để tránh bộ lọc văn bản. AI có thể phân tích nội dung hình ảnh bằng OCR và nhận dạng đối tượng.
Học liên tục (online learning): Mô hình cập nhật theo thời gian thực dựa trên phản hồi của hàng triệu người dùng — khi nhiều người báo cáo cùng một loại email là spam, mô hình nhanh chóng học và chặn các biến thể mới.
6- SpamAssassin — Hệ thống chấm điểm spam
SpamAssassin là công cụ lọc spam mã nguồn mở phổ biến nhất, được Apache Foundation phát triển và sử dụng rộng rãi trên các máy chủ email doanh nghiệp.
Cơ chế chấm điểm:
SpamAssassin đánh giá email theo hàng nghìn quy tắc, mỗi quy tắc cộng hoặc trừ điểm vào tổng điểm spam. Ngưỡng mặc định là 5 điểm — email đạt hoặc vượt ngưỡng này bị phân loại spam.
Ví dụ một số quy tắc và điểm số:
| Quy tắc | Điểm |
|---|---|
| Tiêu đề có nhiều dấu chấm than | +0.5 |
| Không có header Date hợp lệ | +1.0 |
| Nội dung toàn chữ in hoa | +1.0 |
| Từ “FREE” xuất hiện nhiều lần | +1.5 |
| Không vượt qua kiểm tra SPF | +2.0 |
| IP nằm trong danh sách đen Spamhaus | +4.0 |
| Địa chỉ email trong whitelist | -5.0 |
Các module chính của SpamAssassin:
- Bayes module: Tích hợp bộ lọc Bayesian, học từ corpus email đã phân loại.
- Network tests: Kiểm tra DNS blacklist (DNSBL), SPF, DKIM.
- Header analysis: Phân tích cấu trúc header để phát hiện bất thường.
- Body rules: Kiểm tra nội dung, HTML, liên kết.
- Auto-learning: Tự động huấn luyện lại mô hình khi phát hiện xu hướng mới.
Danh sách các từ khóa gây spam cần tránh

Đây là các từ và cụm từ có khả năng cao kích hoạt bộ lọc spam. Lưu ý rằng bộ lọc hiện đại không chặn dựa trên từ đơn lẻ mà xem xét ngữ cảnh tổng thể — nhưng sự xuất hiện dày đặc của các từ này sẽ tăng điểm spam đáng kể.
Nhóm từ “miễn phí” và khuyến mãi
Tiếng Anh:
- Free, FREE, Fr*ee, F.R.E.E
- No cost, at no charge, completely free
- Buy one get one, BOGO
- Click here, Click now, Click below
- Discount, special offer, limited offer
- Congratulations, you’ve been selected
- Winner, prize, reward, gift
- Coupon, voucher, deal, bargain
- Unbeatable price, lowest price, best price
Tiếng Việt:
- Miễn phí, hoàn toàn miễn phí, 100% miễn phí
- Khuyến mãi đặc biệt, ưu đãi hấp dẫn
- Tặng ngay, quà tặng, nhận quà
- Giảm giá sốc, giảm đến 90%
- Chúc mừng bạn đã trúng thưởng
- Nhấp vào đây để nhận, click ngay
Nhóm từ tạo urgency (khẩn cấp)
Tiếng Anh:
- Act now, act immediately, act fast
- Limited time, time-sensitive, expires soon
- Last chance, final notice, final warning
- Urgent, urgent reply needed
- Don’t delete, don’t miss out
- Respond immediately, reply now
- Today only, 24 hours only
- Offer expires, deadline
Tiếng Việt:
- Hành động ngay, làm ngay bây giờ
- Chỉ còn hôm nay, chỉ trong 24 giờ
- Cơ hội cuối, không bỏ lỡ
- Khẩn cấp, phản hồi ngay
- Hạn chót, sắp hết hạn
- Số lượng có hạn, còn rất ít
Nhóm từ tài chính, tiền bạc
Tiếng Anh:
- Make money, make $$$, earn money
- Cash, cash bonus, extra cash
- Income, passive income, additional income
- Investment, investment opportunity
- Guaranteed, guaranteed income, guaranteed profit
- No risk, risk-free, zero risk
- Loans, loan approved, pre-approved
- Debt, debt relief, debt consolidation
- Mortgage, refinance
- Billion, million dollars
- Credit card offers, credit approved
- Get paid, get rich
Tiếng Việt:
- Kiếm tiền, kiếm tiền online, kiếm tiền nhanh
- Thu nhập thụ động, thu nhập khủng
- Đầu tư sinh lời, lợi nhuận cao
- Đảm bảo sinh lời, cam kết lợi nhuận
- Vay tiền nhanh, vay không cần tài sản
- Xử lý nợ xấu, giải quyết nợ
- Làm giàu nhanh, triệu phú
Nhóm từ phổ biến trong phishing
Tiếng Anh:
- Verify your account, confirm your account
- Your account has been suspended
- Unauthorized access detected
- Security alert, security warning
- Update your information, update required
- Password reset, reset your password
- Your payment failed, payment declined
- Bank account, account number, routing number
- Social security, SSN
- Click the link to verify
Tiếng Việt:
- Xác minh tài khoản của bạn
- Tài khoản bị tạm khóa, tài khoản bị hạn chế
- Phát hiện truy cập bất thường
- Cập nhật thông tin ngay
- Đặt lại mật khẩu
- Thanh toán thất bại, giao dịch bị từ chối
- Nhập số thẻ ngân hàng
- Xác nhận danh tính
Cách tránh bị bộ lọc spam đánh dấu

1- Viết tiêu đề email tự nhiên, tránh spam words
Dòng tiêu đề (subject line) là yếu tố đầu tiên và quan trọng nhất bộ lọc kiểm tra.
Nên làm:
- Viết tiêu đề ngắn gọn, mô tả đúng nội dung (dưới 50 ký tự lý tưởng)
- Cá nhân hóa bằng tên người nhận: “Nguyễn Văn A, báo cáo tháng 3 của bạn đây”
- Đặt câu hỏi tự nhiên: “Bạn đã xem tài liệu chúng tôi gửi chưa?”
Không nên làm:
- Viết hoa toàn bộ: “CHƯƠNG TRÌNH KHUYẾN MÃI ĐẶC BIỆT THÁNG NÀY”
- Dùng nhiều dấu chấm than: “Ưu đãi sốc!!!! Mua ngay!!!!”
- Thêm ký tự đặc biệt: “$$$ Kiếm tiền từ nhà $$$”
- Che giấu spam words bằng ký tự: “Fr.ee”, “M0ney”
- Dùng từ giả tạo: “Re:” hoặc “Fwd:” khi không phải reply/forward
2- Cân bằng text và hình ảnh (tỷ lệ 60/40)
Email chỉ gồm hình ảnh hoặc tỷ lệ hình ảnh quá cao là dấu hiệu spam điển hình — spammer thường nhúng toàn bộ nội dung vào ảnh để tránh bộ lọc văn bản.
Tỷ lệ khuyến nghị:
- 60% text, 40% hình ảnh là cân bằng lý tưởng
- Mỗi hình ảnh nên có alt text mô tả
- Không gửi email chỉ gồm 1-2 ảnh lớn và vài dòng text
- Tránh nhúng văn bản quan trọng vào hình ảnh
Ngoài việc tránh spam, tỷ lệ text cao còn giúp email hiển thị tốt khi hình ảnh bị chặn tải (khá phổ biến trên client email doanh nghiệp).
3- Tránh dùng quá nhiều link, đặc biệt link rút gọn
Số lượng và chất lượng của liên kết trong email ảnh hưởng trực tiếp đến điểm spam.
Về số lượng link:
- Không nên nhồi nhét quá nhiều CTA link trong một email
- Nguyên tắc: 1-3 link là hợp lý, trên 5 link bắt đầu tăng rủi ro
- Giữ nhất quán — tất cả link dẫn về cùng một miền chính
Về link rút gọn (bit.ly, tinyurl…):
- Đây là dấu hiệu spam nghiêm trọng vì spammer dùng để che giấu URL thật
- Luôn dùng URL đầy đủ của tên miền chính thức
- Nếu cần theo dõi click, dùng UTM parameter thay vì rút gọn link
Về chất lượng tên miền:
- Gửi email từ tên miền đã thiết lập SPF, DKIM, DMARC
- Tên miền cần có lịch sử gửi mail tốt (domain reputation)
- Tên miền mới đăng ký cần “khởi động” (warm-up) từ từ
4- Cá nhân hóa nội dung email
Bộ lọc spam — đặc biệt là AI filter — nhận biết email được gửi hàng loạt, giống hệt nhau đến nhiều người khác nhau. Cá nhân hóa không chỉ tăng tỷ lệ mở mà còn giảm điểm spam.
Các mức độ cá nhân hóa:
- Cơ bản: Chèn tên người nhận vào tiêu đề và phần đầu email (“Chào anh/chị [Tên],”)
- Trung cấp: Điều chỉnh nội dung theo phân khúc — lịch sử mua hàng, ngành nghề, vị trí địa lý
- Nâng cao: Nội dung động thay đổi hoàn toàn dựa trên hành vi người dùng
Ngoài ra, duy trì danh sách email sạch cũng là yếu tố quan trọng: xóa địa chỉ bounce, người không mở email trong 6+ tháng, và người đã unsubscribe. Gửi đến danh sách chất lượng thấp làm giảm sender reputation nghiêm trọng.
5- Test trước bằng công cụ spam checker
Trước khi gửi chiến dịch email quan trọng, luôn kiểm tra điểm spam bằng công cụ chuyên dụng.
Các công cụ phổ biến:
- Mail Tester (mail-tester.com): Gửi email test đến địa chỉ được cung cấp, nhận báo cáo điểm số chi tiết kèm gợi ý cải thiện.
- MXToolbox: Kiểm tra blacklist, SPF, DKIM, DMARC của tên miền.
- GlockApps: Kiểm tra inbox placement trên nhiều nhà cung cấp email khác nhau.
- Litmus: Kết hợp spam testing với preview hiển thị trên nhiều email client.
Quy trình test nên bao gồm:
1. Kiểm tra SPF/DKIM/DMARC đã thiết lập đúng chưa
2. Chạy email qua spam checker để xem điểm số
3. Xem xét từng cảnh báo và chỉnh sửa nội dung
4. Test lại cho đến khi điểm dưới 3/10 (theo thang Mail Tester)
>> Bạn cũng nên hiểu rõ sự khác biệt giữa spam và email marketing để tối ưu nội dung đúng hướng
Câu hỏi thường gặp về bộ lọc spam
Câu 1: Bộ lọc spam có chặn 100% thư rác không?
Không có hệ thống nào đạt 100% hiệu quả. Ngay cả Gmail với AI lọc spam tiên tiến nhất cũng chỉ đạt trên 99,9% — nghĩa là trong hàng triệu email, vẫn có một số ít lọt qua.
Spammer liên tục thích nghi và tìm cách vượt qua bộ lọc (kỹ thuật gọi là adversarial attack). Khi bộ lọc học cách chặn một kỹ thuật mới, spammer chuyển sang kỹ thuật khác — đây là cuộc đua vũ trang liên tục.
Ngoài ra, tỷ lệ dương tính giả (false positive) — email hợp lệ bị lọc nhầm thành spam — cũng là vấn đề thực tế. Đó là lý do người dùng nên định kỳ kiểm tra thư mục spam để tìm email quan trọng bị lọc nhầm.
Câu 2: Tại sao email hợp lệ vẫn bị lọc vào spam?
Đây là câu hỏi phổ biến nhất từ các marketer và doanh nghiệp. Nguyên nhân thường gặp:
- Thiếu xác thực kỹ thuật: SPF, DKIM, DMARC chưa cấu hình hoặc cấu hình sai.
- Sender reputation thấp: Tên miền hoặc IP có lịch sử gửi spam, tỷ lệ bounce cao, hoặc nhiều người báo cáo spam trước đây.
- Nội dung chứa nhiều spam trigger words: Kể cả khi nội dung hợp lệ, sự kết hợp của nhiều từ ngữ nhạy cảm có thể đủ để vượt ngưỡng.
- Gửi hàng loạt đột ngột: Domain mới hoặc IP mới bắt đầu gửi hàng nghìn email ngay lập tức mà không có giai đoạn warm-up.
- Danh sách email kém chất lượng: Tỷ lệ bounce cứng (hard bounce) cao do email không tồn tại.
- Thiếu link unsubscribe: Email marketing không có cơ chế hủy đăng ký rõ ràng vi phạm CAN-SPAM và tăng rủi ro spam.
Câu 3: Bayesian filter khác AI filter thế nào?
Đây là hai thế hệ công nghệ lọc spam khác nhau về căn bản:
Bayesian filter (Naive Bayes):
- Dựa trên thống kê tần suất từ
- Mô hình đơn giản, nhanh, nhẹ tài nguyên
- Cần được “huấn luyện” thủ công ban đầu bằng corpus email
- Giả định các từ độc lập với nhau — bỏ qua ngữ cảnh câu
- Có thể bị qua mặt bằng cách chèn từ ngẫu nhiên
AI/ML filter (Deep Learning, Transformer):
- Hiểu ngữ nghĩa, ngữ cảnh toàn câu và đoạn văn
- Phân tích đa chiều: nội dung, header, hành vi, hình ảnh
- Tự cập nhật liên tục từ phản hồi hàng triệu người dùng
- Khó bị qua mặt hơn nhiều vì không phụ thuộc vào từ khóa cố định
- Đòi hỏi nhiều tài nguyên tính toán hơn
Trong thực tế, các hệ thống hiện đại thường kết hợp cả hai: Bayesian filter xử lý lớp đầu nhanh chóng, AI filter phân tích sâu hơn các email vượt qua lớp đầu tiên.


