Suy luận nhân quả, câu hỏi lớn và câu hỏi nhỏ

Thử tưởng tượng, bạn ném một quả bóng vào cửa sổ, cửa sổ vỡ. Vậy thì quả bóng là nguyên nhân làm vỡ cửa sổ?
Mr. X uống một viên thuốc, ba ngày sau, ông chết. Vậy viên thuốc là nguyên nhân gây ra cái chết của Mr. X?
(Nguồn ảnh: https://xkcd.com/552/)
Hay trong bức ảnh trên, việc tham gia lớp học thống kê là nguyên nhân khiến người nói không còn nghĩ rằng “correlation implied causation” nữa?
Ba câu hỏi trên đều nhắc đến mối quan hệ nguyên nhân và kết quả, và trong cả ba trường hợp, chúng ta đều không thể đưa ra câu trả lời chắc chắn. Trong ví dụ thứ nhất, có khi nào mọi sự chỉ là trùng hợp, vào cái giây phút ngay trước khi quả bóng chạm cửa sổ, biết đâu đã có một vật khác chạm vào khiến cửa sổ bị vỡ? Ở ví dụ thứ hai, có khi nào do bệnh nặng nên Mr. X mới uống viên thuốc đó, và ông chết là do bệnh chứ không phải do viên thuốc? Ví dụ thứ ba, có khi nào việc tham gia lớp học và việc từ bỏ suy nghĩ ban đầu chỉ là 2 sự kiện trùng hợp?
Những câu hỏi về mối quan hệ nhân quả thực tế không dễ trả lời. Nhưng trước hết, hãy tìm hiểu về khái niệm này.

Quan hệ nhân quả

Quan hệ nhân quả (causality) là mối quan hệ trong đó một sự kiện góp phần trực tiếp gây ra một sự kiện khác (đã sửa). Quan hệ nhân quả thường bị nhầm với một khái niệm anh em là quan hệ tương quan (correlation). Trong khi nhân quả chỉ ra mối quan hệ nguyên nhân - kết quả, thì tương quan chỉ ra mối quan hệ cùng chiều hoặc ngược chiều giữa hai sự kiện. Có quan hệ nhân quả thì chắc chắn sẽ có tương quan, nhưng điều ngược lại không phải lúc nào cũng đúng.
Điều thường gây ra sự nhầm giữa nhân quả và tương quan là việc bỏ qua yếu tố thứ ba tác động đến cả hai sự kiện. Một ví dụ kinh điển là mối quan hệ giữa trình độ học vấn và tiền lương. Nếu bạn thấy những người có trình độ học vấn cao thường có mức lương cao, thì có thể nói rằng tiền lương và trình độ học vấn có mối quan hệ tương quan, nhưng chưa thể kết luận đây là quan hệ nhân quả. Vì có thể hai yếu tố này đều là kết quả của một yếu tố khác – năng lực (ability) của người học, tức là người có năng lực thì thường đủ khả năng học đến các bậc cao hơn, và trong thị trường lao động họ cũng thường tìm được công việc với mức lương tốt.
Ở các trường đại học có điểm đầu vào cao, sinh viên ra trường thường dễ kiếm được việc làm, điều này không có nghĩa học trường đó sẽ giúp sinh viên dễ kiếm được việc. Có thể do ban đầu nhiều sinh viên giỏi thi vào trường, nên điểm đầu vào của trường cao, và cũng nhờ tố chất, các sinh viên này thường dễ dàng kiếm được việc sau khi ra trường. Tiếng lành đồn xa, trường đại học dần trở nên có danh tiếng vì sinh viên dễ kiếm việc, thu hút nhiều sinh viên giỏi, dẫn đến điểm đầu vào cao, ...
Một vấn đề khác thường gặp trong xác định quan hệ nhân quả là nhầm lẫn giữa nhân và quả. Bạn đến một đất nước, bạn để ý thấy rằng có rất nhiều cảnh sát, nhưng đồng thời cũng nhận ra xung quanh có rất nhiều tội phạm. Liệu có phải nhiều cảnh sát là nguyên nhân khiến nơi đây có nhiều tội phạm? Thực ra có thể do nhiều tội phạm nên đất nước mới được trang bị nhiều cảnh sát để đảm bảo an toàn cho người dân.
Một ví dụ khác hóc búa hơn, bạn thích một người, là do bạn thấy người ấy hoàn hảo, hay do bạn thích người đó, nên bạn mới cảm thấy họ hoàn hảo?
Sẽ có rất nhiều cách giải thích cho việc xảy ra đồng thời các sự kiện trên, vậy làm thế nào để đưa ra kết luận liệu có mối quan hệ nhân quả giữa chúng hay không?

Suy luận nhân quả và counterfactual

Câu hỏi về mối quan hệ nhân quả không chỉ dừng lại ở các ví dụ đã nêu, mà còn xuất hiện nhiều trong việc đánh giá ảnh hưởng của một sự kiện, một chương trình can thiệp hay một chính sách: Liệu tăng tiền lương tối thiểu có làm tăng tỷ lệ thất nghiệp? Liệu học đại học có giúp bạn kiếm được nhiều tiền hơn? Việc Trump đắc cử tổng thống năm 2016 có làm cho nước Mỹ “great” hơn? Một loại thuốc mới có giúp cải thiện sức khỏe của người bệnh?
Các câu hỏi trên có điểm chung là đều muốn tìm ảnh hưởng nhân quả của một sự kiện A (việc tăng tiền lương tối thiểu, việc học đại học, Trump đắc cử, sử dụng loại thuốc mới) đến một kết quả B (tỷ lệ thất nghiệp, thu nhập của bạn, tình trạng nước Mỹ, sức khỏe người bệnh).
Để có thể ước lượng được các ảnh hưởng nhân quả này, chúng ta cần đến một thứ gọi là counterfactual (phản thực tế) – tức là tình huống trong đó sự kiện A không tồn tại (đối lập với nó là actual - tình huống trong đó sự kiện A có tồn tại). Kết quả B khi có sự kiện A được gọi là actual outcome, và khi không có sự kiện A là counterfactual outcome. Ảnh hưởng nhân quả, về bản chất, là sự khác nhau giữa kết quả B khi có sự kiện A với khi không có sự kiện A, hay là giữa actual outcome và counterfactual outcome. Việc xác định ảnh hưởng nhân quả được gọi là suy luận nhân quả (causal inference).
Sự kiện thực tế (actual) chỉ có một, nhưng counterfactual thì có thể có nhiều. Ví dụ, counterfactual của việc Trump làm tổng thống có thể là Hillary sẽ là tổng thống, hoặc một ứng cử viên khác, hoặc không ai cả. Mỗi cách chọn counterfactual khác nhau có thể đem đến một kết luận về quan hệ nhân quả khác nhau.

Vậy tại sao chúng ta cần counterfactual? 

Trong ví dụ về tăng tiền lương tối thiểu, nếu chỉ đơn giản quan sát tỷ lệ thất nghiệp sau khi tăng tiền lương thì sẽ không đủ để kết luận về mối quan hệ nhân quả. Tỷ lệ thất nghiệp của đất nước đó có thể tăng nhưng chưa chắc là do tác động của việc tăng tiền lương tối thiểu, mà có thể do khủng hoảng kinh tế, do sự thay đổi trong thị trường lao động, hoặc do các nguyên nhân khác không quan sát được. Counterfactual giúp loại bỏ được khả năng các yếu tố khác, ngoài nguyên nhân mà chúng ta đang quan tâm, có thể làm ảnh hưởng đến kết quả. Chỉ khi so sánh actual outcome và counterfactual outcome của cùng một đối tượng tại cùng một thời điểm thì chúng ta mới có thể tự tin kết luận rằng mối quan hệ ở đây là quan hệ nhân quả.

Tìm counterfactual như thế nào?

Việc tìm được counterfactual tốt chưa bao giờ là đơn giản.
Để biết việc Trump đắc cử có làm nước Mỹ “great” hơn không, chúng ta cần so sánh tình trạng nước này tại cùng 1 thời điểm, ví dụ năm 2020, khi có Trump và khi không có Trump. Để biết tác động của việc học đại học, chúng ta phải so sánh thu nhập của bạn sau 4 năm học đại học, với thu nhập của bạn ở cùng thời điểm đó khi không học. Bạn đã đi học đại học, việc đo thu nhập sau 4 năm của bạn sẽ khá dễ dàng. Nhưng cũng vì bạn đã học đại học, nên không thể biết được thu nhập của bạn sẽ là bao nhiêu nếu không học đại học. Trump đã đắc cử tổng thống năm 2016, không ai biết nước Mỹ sẽ thế nào nếu điều này không xảy ra. Trong thực tế, chúng ta không thể biết được kết quả của cùng một sự vật trong hai trạng thái khác nhau tại cùng một thời điểm.
Một phương án khác là tìm một “bản sao hoàn hảo” của bạn và không cho người này học đại học, sau đó so sánh thu nhập của 2 người sau 4 năm. Nhưng bạn là duy nhất, và đừng so sánh mình với ai khác, người ta thường nói thế, nên việc tìm được bản sao hoàn hảo của bạn cũng là bất khả thi.
Việc tìm counterfactual ở mức độ cá thể có vẻ khó khăn, nhưng xét ở mức độ nhóm có thể sẽ dễ dàng hơn. Dù không thể tạo ra bản sao hoàn hảo cho một người cụ thể, chúng ta có thể tạo ra hai nhóm, mà nếu có số thành viên đủ lớn, sẽ không có khác biệt về mặt thống kê. Khi đó, thay vì tìm tác động cho một cá nhân, chúng ta tìm tác động trung bình cho một nhóm các cá nhân.
Để làm được điều này, người ta thường tạo ra hai nhóm: treatment group (nhóm chịu tác động) và control group (nhóm đối chứng). Trong ví dụ về tác động của thuốc, nhóm gồm những người sử dụng thuốc sẽ được gọi là treatment group, control group sẽ là nhóm những người có đặc điểm thống kê tương tự (tuổi, giới tính, tình trạng bệnh, …), nhưng không sử dụng thuốc. Nếu các đặc điểm của treatment group và control group khác nhau, thì sự khác nhau trong outcome (tình trạng sức khỏe sau này) sẽ có thể bao gồm ảnh hưởng từ các yếu tố khác nữa, chứ không chỉ việc sử dụng thuốc.

Các vấn đề khi xác định ảnh hưởng nhân quả

Để rõ hơn về các vấn đề khi xác định ảnh hưởng nhân quả, hãy thử giúp chính phủ giải toán trong tình huống giả định sau đây.
Giả sử chính phủ đề ra một chương trình hỗ trợ tài chính, cụ thể là cho vay vốn với lãi suất thấp, với mục tiêu cải thiện thu nhập của người dân. Chính phủ quyết định làm thử nghiệm trước trong 3 năm, rồi sau đó mới quyết định có mở rộng chương trình ra toàn quốc hay không. Chương trình sẽ được nhân rộng nếu nó giúp tăng thu nhập bình quân hàng năm trên đầu người ít nhất 5 triệu đồng.
Để bắt đầu, chính phủ thuê một công ty thực hiện khảo sát thu nhập và đặc điểm nhân khẩu học của 5000 hộ gia đình tại 100 xã trên cả nước. Trong 5000 hộ gia đình này, có 3000 hộ đăng ký tham gia chương trình vay vốn. Ba năm trôi qua nhanh như chớp mắt, thời gian thử nghiệm đã kết thúc, một cuộc khảo sát sau chương trình lại được thực hiện, mọi người đều hân hoan đón chờ kết quả. Bây giờ bạn được chính phủ tin tưởng, giao trọng trách đưa ra ý kiến xem có nên mở rộng chương trình này ra toàn quốc hay không. Khi đó, bạn sẽ giải quyết thế nào?
Nếu tạm thời chưa có ý tưởng gì, hãy nhờ đến các chuyên gia.
Chuyên gia thứ nhất xuất hiện. Ông khuyên rằng bạn nên so sánh thu nhập của 3000 hộ gia đình đã tham gia vay vốn ở thời điểm hiện nay với thu nhập của họ 3 năm trước (khi chưa vay vốn). Ông lập luận rằng việc vay vốn giúp người dân có thêm tiền để kinh doanh, sản xuất, nên thu nhập tăng lên chắc chắn là do tác động của chương trình. Nói xong chuyên gia liền bắt tay vào tính toán và còn cẩn thận dùng kiểm định t-stat (kiểm định xem sự khác biệt giữa thu nhập trung bình của các hộ gia đình hiện nay và 3 năm trước có ý nghĩa về mặt thống kê hay không). Bạn vui mừng khi nhìn thấy kết quả: thu nhập trung bình bình quân đầu người trước khi có chương trình là 50 triệu/năm, sau chương trình là 56 triệu, tức là tăng 6 triệu đồng, vui mừng hơn khi vị chuyên gia chắc như đinh đóng cột rằng sự khác biệt này có ý nghĩa thống kê, tức là 99% không thể nào sai được.
Tuy nhiên, bạn thấy hình như mình vui mừng hơi sớm, đã 3 năm trôi qua, sự đời có nhiều thay đổi, việc thu nhập tăng có thể không chỉ đến từ tác động của chương trình cho vay, mà còn có thể từ các yếu tố khác nữa, ví dụ: năm ngoái bỗng dưng mưa thuận gió hòa nên người dân làm ăn khấm khá, đất nước vừa mở cửa nên có nhiều cơ hội việc làm hơn, hàng hóa cũng trở nên rẻ hơn, ...
Nghĩ vậy, bạn mời đến chuyên gia thứ hai. Vị chuyên gia này nói so sánh thu nhập sau khi chương trình kết thúc của 3000 hộ gia đình tham gia vay vốn với 2000 hộ không tham gia mới thực là đúng đắn. Cô phân tích rằng cả 5000 hộ gia đình trong 100 xã đều đối mặt với điều kiện kinh tế - chính trị - xã hội giống nhau, nên nhóm không tham gia có thể được sử dụng như một counterfactual đối với nhóm có tham gia. Bạn thấy có vẻ hợp lý, bèn đích thân tính toán thử, thì thấy thu nhập trung bình bình quân đầu người của nhóm vay vốn thấp hơn 2 triệu đồng/năm so với nhóm không vay, càng đau lòng hơn khi thấy sự khác biệt này là có ý nghĩa thống kê. Bạn vừa buồn vừa tiếc: bao nhiêu tiền đã đổ sông đổ bể, bảo sao nước mình mãi nghèo.
Nhưng nghĩ kĩ lại, bạn nhận ra rằng hai nhóm tham gia và không tham gia có thể khác nhau một cách có hệ thống, tức là sự khác nhau về đặc điểm giữa họ không phải do ngẫu nhiên. Ví dụ, có thể những hộ đăng ký vay vốn có thể là những hộ có thu nhập thấp hơn, nên có động lực vay vốn làm ăn và trả bớt nợ.
Quá bối rối, bạn đành tham vấn một chuyên gia khác. Người này là môn đệ của ba nhà kinh tế học đoạt giải Nobel 2019 với phương pháp thí nghiệm ngẫu nhiên có đối chứng RCT (Randomized Control Trial) – thường được xem là tiêu chuẩn vàng cho việc đánh giá tác động. Chuyên gia này lắc đầu và bảo bạn tìm đến ảnh quá muộn, kèo này hết thuốc chữa rồi. Anh bảo bạn đã sai ngay từ bước đầu tiên: đáng lẽ với những hộ mong muốn vay vốn, phải cho họ quay xổ số, để lựa chọn hộ nào tham gia, hộ nào không. Cách này sẽ giúp đảm bảo không có sự khác biệt mang tính hệ thống giữa hai nhóm, loại trừ vấn đề sample selection bias (sự sai lệch trong việc chọn mẫu). Khi đó, nhóm không tham gia mới có thể đóng vai trò là một counterfactual, chênh lệch thu nhập giữa 2 nhóm sau 3 năm sẽ chỉ chịu tác động bởi một yếu tố là chương trình chăm sóc sức khỏe, bởi không có nguyên nhân nào khác chen chân được vào đây.
Dù vậy, cách quay xổ số như trên cũng mới chỉ đảm bảo được Internal validity, tức là giúp việc chọn counterfactual đủ tốt, nhưng kết quả thu được sẽ chỉ đúng với các hộ gia đình trong nghiên cứu. Nếu muốn biết có thể áp dụng chương trình với quy mô toàn quốc hay không, thì các hộ gia đình tham gia khảo sát phải đại diện được cho tổng thể là tất cả người dân có nhu cầu vay vốn trên cả nước, hay nói cách khác là đảm bảo External validity. Tức, để chọn ra 5000 hộ gia đình, ban đầu bạn phải dùng phương pháp chọn mẫu ngẫu nhiên (random sampling). Có nhiều cách để chọn mẫu ngẫu nhiên, quay xổ số cũng là một cách, tuy nhiên trong thực tế người ta sẽ ít sử dụng vì có thể tốn nhiều chi phí và thời gian.
(Nguồn ảnh: P. Gertler et al (2012))
Bạn thất vọng và chán nản, thấy con đường phía trước sao mà mù mịt, việc đơn giản thế này mà cũng làm không xong thì từ nay làm sao dám bàn chuyện chính trị nữa. Thế rồi vị chuyên gia an ủi bạn rằng, RCT vô cùng tốn kém, mà nhiều khi có tiền cũng chưa chắc làm được, nên không cần phải tiếc. Thấy bạn vẫn còn đau buồn, anh đành tiết lộ một bí mật: thực ra vẫn chưa phải là hết cách, có một vài phương pháp khác để đánh giá tác động như difference-in-difference, sử dụng biến công cụ (instrumental variable), hay matching, ... Nhưng mà kiến thức cơ bản của bạn vẫn còn nhiều lỗ hổng quá, tốt hơn hãy đi học đã rồi về bàn tiếp.
Tình huống giả định trên chỉ nhằm mục đích giúp bạn hiểu hơn về các vấn đề trong suy luận nhân quả. Bạn sẽ nhận ra rằng chúng ta không chỉ bế tắc với những câu hỏi lớn, mà còn cả với những câu hỏi nhỏ xíu xiu, giả như:
Nếu một ngày bạn bảo crush hãy cắt tóc và vài ngày sau thấy tóc của crush đã được cắt, liệu có phải crush làm vậy vì câu nói của bạn? Cứ cho là thế thật, thì liệu nguyên nhân sâu sa là do crush thích bạn, hay chỉ đơn giản là bạn giúp crush nhận ra tóc đã dài và đến lúc cắt đi thôi? Muốn biết thì hãy nói lúc tóc crush không dài, khi ấy nếu crush vẫn đi cắt thì khả năng cao là do lời nói của bạn có sức ảnh hưởng. Nhưng ảnh hưởng như thế nào thì có khi lại phải làm thí nghiệm thêm. Việc này cũng mệt không khác gì đánh giá chính sách, nhưng ít nhất mệt quá thì bạn có thể hỏi thẳng crush một câu là xong, còn với chính sách thì bạn sẽ chẳng biết hỏi ai.

Nếu bạn mệt mà vẫn ngại, có thể đơn giản cứ giữ lấy niềm tin của riêng mình. Mình có một thói quen là mua 2 chiếc bút mới để viết trong những kì thi quan trọng, coi đó như một sự hiện diện của may mắn, dù biết bút mới không giúp mình thông minh hơn, nhưng cứ kệ thôi. Cuộc đời, đôi khi chỉ cần vài niềm tin như thế, để bám víu và để cảm thấy được an ủi, miễn đừng ảo tưởng quá là được.
-----------------------------------------------
À, ở trên vị chuyên gia chỉ bảo hãy đi học, nhưng học ở đâu thì không nói. Vậy mình có thể chỉ cho các bạn nè:
-----------------------------------------------

References:

Gertler, Paul J., Sebastian Martinez, Patrick Premand, Laura B. Rawlings, Christel M. J. Vermeersch (2012). Impact Evaluation in Practice. The World Bank.
Imai, Kosuke. Quantitative Social Science: An Introduction, by Kosuke Imai, Princeton University Press.
51
4808 lượt xem
51
16
16 bình luận