Series vào ngành Data thời AI: AI làm hết task của DA rồi, liệu còn cửa vào ngành Data không?
Dạo gần đây mình nhận được thêm khá nhiều câu hỏi về việc AI làm hết task của DA rồi, liệu còn cửa vào ngành Data không? Đang muốn làm Series vào ngành Data thời AI nên mình sẽ dành thời gian để viết các post và quay video giải đáp mấy thắc mắc này luôn ^^
Mình nghĩ để trả lời câu hỏi này thì mình sẽ start trước bằng việc AI đang làm các task gì của Data Analyst?
AI đang “cướp đi” những phần việc nào của Data Analyst?
Cũng cần phải thú nhận với nhau chút là AI đang tác động rất khủng khiếp vào công việc của DA.
Mình có ngồi review lại quá trình mình dùng AI để làm việc với Data và tổng hợp được các khía cạnh công việc chính mà hiện nay AI có thể làm rất tốt:
Query và xử lý dữ liệu
Query và cleaning data có thể nói là một trong những task vô cùng basic của một Data Analyst.
Nếu bạn đã nghe câu: “80% thời gian của Data Analyst dùng để cleaning data” hoặc từng nhìn thấy mấy chiếc meme về việc ngồi clean data cả ngày thì chắc bạn sẽ hiểu mình đang nói gì :))))
Hồi xưa mỗi khi đối mặt với một bài toán cần query gì đó, mình sẽ tốn khoảng 5 10 phút để viết một đoạn query đơn giản, phức tạp hơn thì 20 30 phút viết query là chuyện bình thường.
Nhưng mà AI có thể làm điều đó trong vài giây, tất cả những gì bạn cần làm là mô tả cho nó lại structure trong database: bao gồm bảng nào, các cột là gì, bảng liên hết với nhau bởi cái gì, là nó có thể viết được hết. Thậm chí còn có thể suggest cách viết query tốt hơn, rồi giúp debug lỗi.
Không dừng lại ở SQL, mà tất tần tật các thể loại code từ hàm Excel, DAX, Python,… mà bạn dùng để query và xử lý dữ liệu, AI đều có thể viết được.
Slide minh họa ứng dụng AI để xử lý dữ liệu trên Excel - Được dạy trong học phần Data Analysis của lộ trình Professional Data Analyst Program
Thậm chí sau này khi mình tự học thêm về Data Engineer, phải làm thêm phần transform data để build pipeline, có những structure data khá phức tạp như JSON, mình cũng thường nhờ AI xử lý hoặc suggest cho mình viết.
Đương nhiên điều tiên quyết vẫn là mình phải có base căn bản, và viết được mình muốn gì để brief cho AI.
Có thể nói là AI gần như “ăn trọn” phần technical data handling cơ bản.
Phân tích dữ liệu
Như mình đã từng chia sẻ trong một notes khác của mình. Bản thân mình thì thường nhìn vào 3 tầng thế này khi gặp một bài toán phân tích
What happened
Why it happened
So what / Now what
AI sẽ giúp bạn rất tốt trong phần what, vì nó tổng hợp thông tin siêu tốt. Hiểu đơn giản thì từ data hay chart bạn đưa vào, AI có thể:
Đọc được số nào tăng, số nào giảm
Tính mean, median, mode
Tóm tắt lại nội dung
Highlight một vài pattern phổ biến
…
Khi bạn input cho nó thêm các context, ví dụ mục tiêu của campaign này, đâu là những chỉ số quan trọng cần nhìn, mối liên hệ,… nó sẽ giúp bạn trả lời được 1 phần why.
Và cuối cùng là So What, AI sẽ có thể suggest các hướng hành động, idea optimization,… khá ổn.
Nếu nhìn theo 3 layer:
What → AI làm rất tốt
Why → AI hỗ trợ
So what → AI có thể gợi ý
Tức là AI không chỉ dừng ở việc “đọc data”, mà còn có thể support xuyên suốt cả quá trình phân tích.
Đương nhiên là còn có một số hạn chế, nhưng AI hiện tại đang làm khá tốt những gì một fresher Data Analyst có thể làm khi xét về khía cạnh phân tích.
Data Visualization & viết báo cáo
Bản thân mình thì không dùng nhiều AI trong việc visualization lắm, mình chỉ mới phát hiện ra gần đây thôi, nhưng mà thật sự những gì AI làm được rất đáng ngạc nhiên.
Đây là một vài ví dụ để bạn hình dung kỹ hơn về những gì AI có thể làm
Hình dưới là mình bảo ChatGPT fake một chút data, sau đó bỏ vào 1 tool AI để nhờ nó suggest chart & phân tích cơ bản.
Hoặc một ví dụ khác của mình về việc mình làm market research về ngành Data sau đó đưa cho Claude để visualize.
Tất cả đều chỉ đang dùng AI để làm chứ mình chưa hề touch để input thêm domain của mình.
Bạn có thể đọc detail hơn ở đây.
Nếu bạn đang hình dung Data Analyst như một người chỉ có: ăn, ngủ, vẽ dashboard, làm báo cáo thì mình có thể nói là AI chuẩn bị ăn đứt rồi :)))))
Tự động hóa
Chưa dừng ở việc làm các task của AI nhỏ lẻ đâu, AI còn có thể kết hợp nó thành một workflow hoàn chỉnh trơn tru từ đầu đến cuối, mà thâm chí còn chẳng cần đến con người can thiệp vào.
Ví dụ đây là một workflow để craw thông tin các bài post & comment trong các group Facebook mà mình học được trong khóa AI Marketing ở cty mình mà chẳng cần dùng đến Python.
Mình có share chi tiết bài này trong post này:
Bạn hãy thử tưởng tượng chuyện gì sẽ xảy ra nếu mình cắm thêm vào workflow trên một con AI Agent để giúp mình đọc, vẽ chart và phân tích data? Gần như toàn bộ pipeline, toàn bộ task của DA trong project này đều đã được tự động hóa.
Đọc tới đây mình đoán chắc bạn cũng hơi “rén” nhẹ rồi :)))) Vì gần như từ query, xử lý data, phân tích cho tới visualize, AI đều đã nhúng tay vào hết.
Vậy thì câu hỏi tiếp theo sẽ là:
Vậy AI chưa làm được gì? Còn lại gì cho Data Analyst?
Tiêu cực đủ rồi giờ đến phần tích cực, theo cá nhân mình thì vẫn có rất nhiều value “đáng tiền” của một DA mà AI vẫn chưa thể thay thế được.
AI không hiểu được bài toán kinh doanh
AI có thể làm rất tốt phần phân tích mô tả, có thể chỉ ra số nào tăng số nào giảm, nhưng mà để rút ra được insight thực sự thì lại là một câu chuyện khác. Insight phụ thuộc rất nhiều vào “domain knowledge” của người phân tích.
Cụ thể hơn là:
Hiểu bài toán kinh doanh thật sự là gì
Biết metric nào quan trọng, metric nào “vô nghĩa”
Và quan trọng nhất là “đặt câu hỏi đúng”
Các framework giúp bạn “đặt câu hỏi đúng” - Được dạy trong học phần Data Analysis của lộ trình Professional Data Analyst Program
Ví dụ như khi phân tích một campaign ads. AI sẽ đọc được reach của ads này đang là bao nhiêu, CPC là nhiêu, đang convert được ra bao nhiêu lead, CPL là bao nhiêu,… Nếu các chỉ số này thấp có khả năng cao nó sẽ cho là campaign này đang không hiệu quả.
Trong khi một người “có domain” biết được rằng à oke chiến dịch này tôi đang chạy với mục tiêu brand buidling/ awarness với mục tiêu này thì tôi chỉ quan tâm đến chỉ số reach, frequency brand recall lift, còn tỷ lệ chuyển đổi ra lead có thấp một chút cũng không sao, quảng cáo đó sẽ vẫn được coi như hiệu quả.
Chính thiếu hụt về mặt domain, rồi business understanding đó là lý do vì sao dùng AI để đọc số nhưng vẫn thấy “chưa đủ sâu”.
AI không hiểu được context của dữ liệu
Một điểm yếu nữa của AI chính là AI không có context nội bộ :))) vì về cơ bản thì cũng không ai muốn leak toàn bộ data công ty cho AI cả, nhỡ đâu một ngày đẹp trời lại thấy data của mình bị bán :)))
Chính vì vậy, AI sẽ không thể hiểu được những thứ như:
Data pipeline của công ty bạn đang setup thế nào
Data mart gồm các bảng nào
Campaign đang chạy kiểu gì
Tracking có đang đúng hay không
…
Nhưng đây lại là những thứ cực kỳ quan trọng cần biết trong quá trình phân tích, nó cũng hơi linking với ý domain bên trên
Nếu bạn không cung cấp cho AI những thứ như vậy thì AI gần như sẽ giống một đứa fresher DA biết rất nhiều tool, nhưng không biết mình đang phân tích hay ứng dụng cái gì cả.
À bạn có thể đọc bài post này của mình để hiểu hơn về cách hoạt động của AI:
AI không thể thay thế con người đưa ra quyết định
Và point quan trọng cuối cùng, kể cả AI có thể làm tất cả những việc từ query, xử lý data, phân tích cho tới visualize, nó không thể thay thế một DA trong việc ra quyết định.
Bởi trong thực tế, không có quyết định nào là “đúng tuyệt đối”. Mỗi lựa chọn đều đi kèm:
trade-off
rủi ro
và hệ quả phía sau
Các phương pháp ra quyết định hiệu quả dựa trên dữ liệu - Được dạy trong học phần Decision Science của lộ trình Professional Data Analyst Program
AI dù có thể suggest rất nhiều ý tưởng và phân tích rất hợp lý nhưng nó sẽ khoogn phải là người đứng ra chịu hậu quả nếu sai.
Giống như việc bạn không thể bắt AI đi tù thay cho kế toán vậy :))))
Quay lại câu hỏi key: Vậy ngành Data còn cửa không?
Như mình đã share trong một notes ngắn của mình:
Ngành DA cũng sẽ không hạ nhiệt quá nhanh, cái mà thực sự thay đổi là yêu cầu của ngành đối với vị trí DA.
Trước đây, chỉ cần giỏi technical, biết SQL, biết Power BI, làm vài dashboard là có thể apply DA. Nhưng bây giờ những thứ đó gần như đã trở thành baseline, vì AI có thể làm được hết (nhưng không đồng nghĩa với việc mình không học nha :))) mình vẫn thuộc trường phái dù có AI làm bạn vẫn phải học căn bản).
Doanh nghiệp không tìm một DA chỉ biết tool, biết vẽ chart, chạy SQL hay viết Python một cách chung chung. Họ tìm người có thể giúp họ giải quyết các bài toán.
Ví dụ:
Nếu họ chưa có database, mình xây cho họ.
Nếu họ cần tối ưu doanh thu, mình build dashboard để theo dõi từng ngày và tìm ra điểm nghẽn.
Nếu quy trình còn thủ công và tốn quá nhiều nhân lực, mình tìm cách automate lại.
Thầy dạy mình hay gọi vui là hãy cố gắng trở thành “thợ đụng” đụng đâu giải quyết cái đó :)))))
Khi mình nhìn bản thân như một người giải quyết bài toán, tạo ra giá trị thay vì một người sử dụng công cụ, nó sẽ reflex cả vào cách mình xây portfolio và cả cách mình thể hiện trong phỏng vấn luôn. Khi bạn chứng minh được mình luôn mang lại một value cụ thể cho tổ chức, thì dù ở môi trường nào, bạn vẫn có cơ hội.
Tạm kết
Ngành Data vẫn còn “sáng cửa” nhưng “cửa dễ vào” của nó thì đã không còn nữa rồi :))) cũng hơi buồn cho các bạn vẫn đang đi theo cách cũ.
Nhưng mình tin là nễu bạn thay đổi tư duy của mình, không chỉ coi DA là một người thợ clean data, thợ vẽ dashboard, mà là một người giúp doanh nghiệp giải quyết vấn đề và có một lộ trình phù hợp để build bộ skills liên quan thì cơ hội vẫn còn rất nhiều. Nó sẽ khó hơn một chút, nhưng nếu bạn làm được thì bạn sẽ “đáng tiền” hơn rất nhiều.
Nếu bạn đang muốn tham khảo một lộ trình học Data Analyst một cách bài bản, trang bị đủ các kiến thức & kỹ năng cần thiết để vào ngành Data trong thời AI, hãy tham khảo Professional Data Analyst Program của TM Data School nha!
Đọc bài gốc tại đây:

















