Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo

Download

NGHIEÂN CÖÙU TRAO ÑOÅI

VAI TrOØ CUÛA KHAI pHAÙ DÖÕ LIEÄU

TrONG LÓNH VÖÏC KIEÅM TOAÙN

VAØ DÒCH VUÏ ÑAÛM BAÛO

S. NGUYỄN VĩNH KHươNG*

S. PHÙNG ANH THư*

ữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng, tăng nhanh về khối lượng,

phát triển mạnh về quy mô khiến việc phân loại, lựa chọn, khai phá, sử dụng gặp những

khó khăn nhất định. Mục tiêu bài viết nhằm tổng quan các ứng dụng của kỹ thuật khai

phá dữ liệu trong lĩnh vực kiểm toán. Ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán

liên quan đến dịch vụ đảm bảo và tính tuân thủ (phát hiện gian lận, tình hình tài chính) và kế toán điều

tra. Qua đó, giúp hiểu hơn về vai trò của khai phá dữ liệu và rộng hơn là dữ liệu lớn (big data), cũng như

cơ hội cho các nghiên cứu ứng dụng trong tương lai.

Từ khóa: khai phá dữ liệu; kiểm toán.

e role of data mining in the audit arrangement and assurance service

Man-made data is becoming more and more quantitatively, rapidly growing in volume, and growing in

scale which has made the classiﬁcation, selection, exploration and use relatively diﬃcult. e article objective

is to review the application of data mining techniques in the ﬁeld of auditing. Application of data mining

in the ﬁeld of audit related to assurance services and compliance (fraud detection, ﬁnancial situation) and

forensic accounting. ereby, the article provides better understanding of the role of data mining and, more

broadly, the big data, as well as opportunities for future application research.

keywords: Data mining, auditing

1. Giới thiệu

Khai phá dữ liệu là một trong những ứng dụng

quan trọng nhất trong phân tích nghiệp vụ và các

công cụ hỗ trợ quyết định. Điều này được xác nhận

bởi các tổ chức, Hiệp hội nghề nghiệp về kế toán.

Viện Kế toán Công chứng Hoa Kỳ (AICPA) đã xác

định khai phá dữ liệu là một trong mười công nghệ

hàng đầu cho tương lai, và Viện Kiểm toán Nội

bộ Hoa Kỳ (IIA) đã liệt kê khai phá dữ liệu là một

trong bốn ưu tiên nghiên cứu (Koh và Low, 2004).

Ngoài ra, Viện Kế toán Quản trị Công chứng Anh

(CGMA) đã báo cáo rằng hơn 50% các nhà lãnh

đạo doanh nghiệp xếp hạng dữ liệu lớn và khai phá

dữ liệu trong số các đầu mười ưu tiên của công

Trong kỷ nguyên của nền kinh tế toàn cầu hoá,

thị trường cạnh tranh cao, các tổ chức cần tăng

tính cạnh tranh thông qua việc chấp nhận hoặc

thực hiện nhiều triết lý kinh doanh và ứng dụng

các công nghệ thông tin tiên tiến (Dorsch và Yasin,

1998). Đặc biệt, trí tuệ nhân tạo (AI) rất quan trọng

đối với tương lai của ngành kế toán (Elliott, 1992)

và các hệ thống thông minh đã tăng cường nhiều

khả năng phân tích và tăng hiệu quả của các quy

trình kế toán (Granlund, 2011). Do đó, có những

lời kêu gọi rõ ràng rằng trí tuệ nhân tạo xứng đáng

được chú ý hơn (Debreceny, 2011).

*Trường Đại học Kinh tế-Luật_ĐHQG HCM; Đại học Nguyễn Tất ành

30 Số 119 - tháng 9/2017 NGHIÊN CỨU KHOA HỌC KIỂM TOÁN

ty, là nền tảng của kỷ nguyên dữ liệu trong kinh

doanh (CGMA, 2013). Khai phá dữ liệu đã được

định nghĩa là quá trình xác định các mẫu dữ liệu

có giá trị, có tiềm năng và khuôn mẫu mới nhất

(Pujari, 2001). Khai phá dữ liệu còn được gọi là quá

trình khai phá hoặc khai phá kiến thức từ những

dữ liệu lớn (Han và cộng sự, 2006) để cải thiện các

quyết định trong một ngành cụ thể. Do đó, trọng

tâm chính của khai phá dữ liệu là tận dụng các tài

sản dữ liệu của một tổ chức để thu được lợi ích tài

chính hoặc phi tài chính. Do đó, việc khai phá dữ

liệu đã được áp dụng cho hầu hết các ngành kinh

doanh, kể cả lĩnh vực kế toán, kiểm toán.

quan một cách hệ thống các nghiên cứu đã công

bố về các ứng dụng khai phá dữ liệu trong lĩnh vực

kiểm toán nhằm mở ra các chủ đề cho mục đích ứng

dụng và nghiên cứu.

2. khái niệm về khai phá dữ liệu

Khai phá dữ liệu là việc áp dụng các thuật toán

cụ thể để trích các mẫu từ dữ liệu. Khai phá dữ liệu

cho phép khám phá tự động các mô hình tiềm ẩn

và kiến thức thú vị ẩn chứa trong một lượng lớn

dữ liệu (Jiawei và Kamber, 2001). Việc khai phá dữ

liệu giúp các tổ chức tập trung vào những thông

tin và kiến thức quan trọng nhất có sẵn trong cơ

sở dữ liệu hiện có của công ty. Nhưng khai phá dữ

liệu chỉ là một công cụ, do đó, không loại trừ nhu

cầu kinh doanh, hiểu về dữ liệu hoặc để hiểu các

phương pháp phân tích liên quan (Jackson, 2002)

Kế toán doanh nghiệp có vai trò rất quan trọng

đối với việc cung cấp thông tin kế toán phục vụ công

tác quản lý và điều hành doanh nghiệp, là cơ sở cho

việc ra quyết định kinh tế và điều hành của doanh

nghiệp. Nhiệm vụ này liên quan đến nhiều sự kiện

không chắc chắn và rủi ro phức tạp. Lĩnh vực kế toán

sử dụng các ứng dụng thông minh có từ hơn ba thập

niên qua (Baldwin và cộng sự, 2006) và một trong số

đó là việc sử dụng khai phá dữ liệu để giải quyết tốt

hơn những rủi ro và sự kiện phức tạp. Nhiều nghiên

cứu đã được công bố mô tả các ứng dụng khai phá

dữ liệu trong kế toán. Mục tiêu của bài báo là tổng

Khai phá dữ liệu có ba mục tiêu chính: mô tả, dự

đoán và đề xuất. Trong khi mô tả tập trung vào việc

xác định các mẫu mô tả về hành vi con người thông

qua dữ liệu, dự đoán liên quan đến việc sử dụng

một số biến hoặc các yếu tố trong cơ sở dữ liệu để

dự đoán các giá trị chưa biết hoặc tương lai của các

biến số được quan tâm khác (Fayyad và cộng sự,

1996). Mặt khác, đề xuất tập trung vào việc cung

NGHIÊN CỨU KHOA HỌC KIỂM TOÁN Số 119 - tháng 9/2017 31

NGHIEÂN CÖÙU TRAO ÑOÅI

cấp giải pháp tốt nhất cho vấn đề nhất định (Evans,

2013). Các mục tiêu này có thể đạt được bằng cách

sử dụng nhiều nhiệm vụ khai phá dữ liệu bao gồm

phân loại, phân cụm, dự đoán, phát hiện ngoại lai,

tối ưu hóa và khái quát hóa. Những nhiệm vụ được

giải quyết thông qua:

toán). Khai phá dữ liệu cũng đã được áp dụng sau

khi chu kỳ kiểm toán hoàn thành, bao gồm sự tác

động và hậu quả của ý kiến kiểm toán.

Trong giai đoạn ký kết hợp đồng, khai phá dữ

liệu đã được sử dụng để dự đoán việc lựa chọn

của kiểm toán viên (Kirkos và cộng sự., 2010) và

chuyển đổi (Kirkos, 2012) để tìm ra sự phù hợp tối

ưu giữa các đặc tính của cuộc kiểm toán và chuyên

gia kiểm toán trong lĩnh vực xây dựng (Wang và

Kong, 2012) và phân loại mức chi phí cho cuộc

kiểm toán và đưa ra sự thay đổi trong giá phí kiểm

toán (Curry và Peel, 1998; Beynon và cộng sự,

2004). Trong môi trường giàu thông tin ngày nay,

đánh giá rủi ro liên quan đến nhận dạng các mẫu

trong dữ liệu, chẳng hạn như dữ liệu bất thường

phức tạp và sự khác biệt có thể che giấu một hoặc

nhiều lỗi trọng yếu (Ramamoorti và cộng sự, 1999).

Calderon (1999) và Ramamoorti và cộng sự (1999)

nghiên cứu khả năng của mạng lưới thần kinh để

tăng cường quá trình đánh giá rủi ro của kiểm toán

viên. Kết quả nghiên cứu cho rằng mô hình mạng

thần kinh có giá trị trong việc định hướng kiểm

toán viên nội bộ dành sự quan tâm đến những khía

cạnh của tài chính, vận hành và tuân thủ ở các khu

vực kiểm toán có nguy cơ cao và do đó tăng hiệu

quả của cuộc kiểm toán. Tương tự, Davis và cộng

sự (1997) và Hwang và cộng sự (2004) đã phát triển

mô hình mạng lưới thần kinh để hỗ trợ các kiểm

toán viên thực hiện đánh giá rủi ro kiểm soát. Kết

luận rằng mạng nơ ron cung cấp cho kiểm toán viên

một cách hiệu quả để nhận dạng các mẫu trong số

lượng lớn các mối quan hệ mà các mối quan hệ liên

biến này có thể thay đổi và các kiểm toán viên có

kinh nghiệm cũng không thể mô tả được. Tương

tự, Issa và Kogan (2014) đề xuất một dự đoán mô

hình hồi quy xác suất như một công cụ để đánh giá

chất lượng các đánh giá rủi ro kiểm soát và do đó

cải thiện hiệu quả kiểm toán bằng cách tập trung

vào vùng rủi ro hoặc ngoại lai.

■ Phân loại tập trung vào việc lập bản đồ dữ liệu

cho tập hợp các lớp thuộc tính, có thể là nhị phân

hoặc đa lớp.

■ Phân cụm tập trung phân tách dữ liệu thành

một số nhóm có ý nghĩa.

■ Dự đoán tập trung vào việc xác định giá trị số

học trong tương lai (dự báo) hoặc không phải là giá

trị số học (phân loại).

■ Phát hiện ngoại lai tập trung vào việc xác

định các dữ liệu quan trọng có sai lệch so với dữ

liệu chuẩn.

■ Tối ưu hóa tập trung vào việc tìm ra giải pháp

tốt nhất cho một số tài nguyên.

■ Khái quát hóa tập trung vào việc trình bày

trực quan và hiểu biết về dữ liệu.

■ Hồi quy tập trung vào ước lượng một biến phụ

thuộc từ tập hợp các biến độc lập.

3. Vai trò của khai phá dữ liệu trong lĩnh vực

kiểm toán và dịch vụ đảm bảo

3.1. Kiểm toán

Các giao dịch kế toán đang trở nên phức tạp và

dễ dàng hơn để thao tác với việc sử dụng ngày càng

tăng của hệ thống trực tuyến và sự gia tăng của các

thiết bị thông minh và sự kết nối vạn vật (IoT).

Điều này đòi hỏi sự chuyên nghiệp về nghề kiểm

toán cao hơn, bao gồm việc sử dụng kỹ thuật khai

phá dữ liệu ngày càng tăng. Vai trò quan trọng của

công nghệ thông tin ngày càng đóng vai trò quan

trọng trong nâng cao hiệu quả của quá trình giám

sát và kiểm soát (Daigle và Lampe, 2005). Khai phá

dữ liệu đã được áp dụng trong suốt chu trình kiểm

toán: lập kế hoạch (như cam kết, đánh giá rủi ro,

lập kế hoạch kiểm toán), thực hiện (chủ yếu thực

hiện thử nghiệm cơ bản) và báo cáo (báo cáo kiểm

Trong lập kế hoạch kiểm toán, Ragothaman và

cộng sự (1995) đã phát triển hệ thống tiếp cận theo

nguyên tắc giúp các kiểm toán viên ở giai đoạn lập

32 Số 119 - tháng 9/2017 NGHIÊN CỨU KHOA HỌC KIỂM TOÁN

kế hoạch thiết kế các thử nghiệm cơ bản, khi các sai

sót trọng yếu và các sai sót trong báo cáo tài chính

có thể xảy ra. ể hiện rằng hệ thống này hoạt động

tốt hơn mô hình dựa trên phân tích phân biệt trong

phân loại các lỗi và không lỗi. Nhưng kích thước

mẫu được sử dụng trong nghiên cứu giới hạn tính

tổng quát của các quy tắc được tạo ra.

Coakley (1995) đề xuất việc sử dụng các mạng thần

kinh trong nhận dạng mô hình của các tín hiệu cần

xem xét được tạo ra bởi các thủ tục phân tích. Kết

luận rằng việc sử dụng mạng nơron cung cấp một

chỉ dẫn đáng tin cậy hơn về sự có mặt của các sai

sót trọng yếu so với các thủ tục hoặc phân tích mẫu

truyền thống. Phân tích và cung cấp cái nhìn sâu

hơn về các nguyên nhân chính đáng của những sai

sót này. Kết quả của họ cho thấy việc sử dụng một

ANN để phân tích các mô hình các biến dạng liên

quan đến nhiều tỷ lệ tài chính cung cấp một chỉ

dẫn đáng tin cậy hơn về sự hiện diện của sai sót

trọng yếu hơn các thủ tục phân tích truyền thống

hoặc phân tích mẫu, cung cấp hiệu suất được cải

thiện trong việc nhận ra các sai sót trọng yếu.

Trong giai đoạn thực hiện kiểm toán, Argyrou

và Andreev (2011) đã đề xuất công cụ bán giám sát

cho việc tập hợp cơ sở dữ liệu kế toán như một quy

trình kiểm soát nội bộ thông qua việc sử dụng các

bản đồ tự tổ chức để bổ sung cho việc kiểm soát

nội bộ, xác minh việc xử lý kế toán các giao dịch và

đánh giá báo cáo tài chính. Kết quả thực nghiệm

cho thấy công cụ đề xuất có thể nén một số lượng

lớn các giao dịch kế toán, tạo ra các cụm đồng nhất,

tách biệt, và có thể hiểu được. Trong thực hiện

thử nghiệm cơ bản, Coakley và Brown (1993) và

Koskivaara (2000) đã sử dụng các mạng thần kinh

trong việc dự đoán các mẫu trong kiểm toán số dư

hàng tháng như là một phần của quá trình đánh giá

phân tích của kiểm toán viên và cho thấy rằng các

mạng nơron nhận ra các mẫu trong tài khoản cũng

như mối quan hệ giữa các tài khoản này hiệu quả

hơn so với phân tích tỷ số và phương pháp hồi quy.

Trong hậu chu kỳ kiểm toán, nội dung thông

tin về giả định hoạt động liên tục của kiểm toán

viên có ảnh hưởng đáng kể đến vị thế hiện tại và

tương lai của một công ty. Jones (1996) đã kiểm

tra các khoản lợi nhuận bất thường của cổ phiếu

xung quanh việc công bố báo cáo hoạt động liên

tục của kiểm toán viên bằng cách sử dụng hồi quy

bình thường nhỏ nhất và nhận thấy rằng hồi quy

bình phương nhỏ nhất bình thường cho thấy rằng

lợi nhuận bất thường trung bình xung quanh việc

NGHIÊN CỨU KHOA HỌC KIỂM TOÁN Số 119 - tháng 9/2017 33

NGHIEÂN CÖÙU TRAO ÑOÅI

phá sản (Tseng và Hu, 2010, Kim và Kang, 2010;

Jardin, 2010; Tseng và Hu, 2010) với thỏa thuận

không nhất trí về kỹ thuật mô hình hóa nào mang

lại dự đoán tốt nhất. Tóm lại, không có bằng chứng

nào cho thấy một kỹ thuật khai phá dữ liệu tốt

hơn các kỹ thuật khai phá dữ liệu khác trong mọi

trường hợp.

công bố báo cáo của kiểm toán viên thấp hơn đối

với các ý kiến quan tâm đến hoạt động chứ không

phải do ý kiến rõ ràng và mức độ của các khoản lợi

nhuận bất thường phụ thuộc vào mức độ mà loại

ý kiến không được kỳ vọng đối với các nhà đầu tư.

3.2. Tình hình tài chính

Dự báo phá sản là một chủ đề quan trọng đã

được nghiên cứu rộng rãi và đa quốc gia trong các

nghiên cứu trước đây. Nhiều tác giả đã sử dụng

kỹ thuật khai thác dữ liệu để dự báo phá sản (Jo

et al., 1997, O’Leary, 1998, Yang và cộng sự, 1999,

Zhang và cộng sự, 1999. Charalambous và cộng

sự, 2000Tsai và Wu, 2008, Chen và các cộng sự,

2009a, 2009b, Olson và cộng sự, 2012, Kasgari

và cộng sự, 2013; Korol, 2013; Serrano-Cinca và

Gutiérrez-Nieto, 2013; Tinoco và Wilson, 2013).

Kết quả nghiên cứu Yang và cộng sự (1999) về sự

lan truyền ngược lại đã không phân biệt được giữa

các công ty bị phá sản và không phá sản và tính

ưu việt của phân tích hồi quy tuyến tính đối với

mạng nơ-ron xác suất. Mặt khác, Zhang và cộng sự

(1999) đã báo cáo rằng các mạng nơ ron mạnh mẽ

để lấy mẫu các biến thể về hiệu suất phân lớp tổng

thể. Shirata và cộng sự (2011) chứng minh hiệu quả

của dự đoán phá sản khai phá qua văn bản, trong

đó một số kết hợp các thuật ngữ có hiệu quả trong

việc phân biệt giữa các công ty phá sản và không

phá sản. Cụ thể hơn, Pompe và Bilderbeek (2005)

đã kiểm tra các yếu tố dẫn đến dự báo phá sản, và

nhận thấy rằng các mô hình được tạo ra từ báo cáo

tài chính hàng năm, cuối cùng đã được công bố

trước khi phá sản ít thành công hơn trong dự báo

thất bại kịp thời và sự suy giảm kinh tế trùng khớp

với sự suy giảm hiệu suất của mô hình . Mặc dù tất

cả các tác giả này chỉ sử dụng các biện pháp định

lượng, chủ yếu là tỷ lệ tài chính, trong mô hình dự

báo phá sản. Anandarajan và cộng sự (2001) đã sử

dụng các biện pháp định tính và định lượng. Trong

khi Cho và cộng sự (2009) đã phát triển một mô

hình tổng hợp kết hợp các kỹ thuật thống kê và trí

tuệ nhân tạo để dự báo phá sản, một số khác tập

trung vào tính chính xác của các mô hình dự báo

3.3. kế toán điều tra

AICPA công nhận trách nhiệm của kiểm toán

viên trong việc phát hiện gian lận (Cullinan và

Sutton, 2002). Việc phát hiện thao túng báo cáo

tài chính bằng cách sử dụng các thủ tục kiểm toán

thông thường đã trở thành một nhiệm vụ rất khó

khăn (Dikmen và Küçükkocaoğlu, 2010). Đánh

giá rủi ro gian lận là quá trình rất phức tạp và một

phần của tất cả các cuộc kiểm toán. eo thời gian,

các yêu cầu bắt buộc đã tăng nhanh chóng, khoảng

thời gian và nỗ lực của kiểm toán viên để đánh giá

gian lận. Do đó, đánh giá rủi ro gian lận tạo ra cơ

hội lý tưởng cho sự hỗ trợ kỹ thuật (Comunale và

cộng sự, 2010). Việc rà soát các nghiên cứu cho

thấy việc sử dụng phổ biến khai phá dữ liệu của các

nhà nghiên cứu và các học viên để phát hiện gian

lận. Các nhà nghiên cứu giải quyết ở mức độ khác

nhau đối với các dạng gian lận.

Một số tập trung vào việc phát hiện rủi ro gian

lận ở mức độ vĩ mô nhiều hơn ở cuộc kiểm toán

(Comunale và cộng sự, 2010) và một số khác tập

trung vào việc phát hiện gian lận ở cấp độ vi mô

hơn của các giao dịch kinh doanh (Debreceny và

Gray, 2010; Bella và cộng sự, 2009; Tackett, 2013).

Trong khi đó, Debreceny và Gray (2010) đã nghiên

cứu sự gian lận trong các bút toán bằng cách sử

dụng phân tích số liệu và phát hiện ra rằng sự phân

bố các chữ số đầu tiên của số tiền trong bút toán

khác với quy luật của Benford, Bella và cộng sự

(2009) đã phát triển cấu trúc bốn bước để phát hiện

gian lận của các hồ sơ thanh toán điện tử và Tackett

(2013) đã đề xuất việc sử dụng các quy tắc liên kết

trong việc phát hiện gian lận thông qua các mẫu và

mối quan hệ khi kiểm tra nghiệp vụ kinh tế. Mặt

khác, Bay và cộng sự (2006) tập trung vào việc xác

34 Số 119 - tháng 9/2017 NGHIÊN CỨU KHOA HỌC KIỂM TOÁN

định những bất thường ở sổ cái (Jans và cộng sự,

2010; Jans và cộng sự, 2011; Owusu-Ansah và cộng

sự, 2002) và tập trung vào việc phát hiện gian lận ở

chu kỳ kinh doanh hoặc quy trình. Trong khi Jans

và cộng sự (2010) sử dụng kỹ thuật khai phá dữ liệu

mô tả để phát hiện và giảm nguy cơ gian lận nội

bộ ở cấp độ chu trình kinh doanh, Jans và cộng sự

(2011) đã kiểm tra tính hiệu quả của thủ tục kiểm

tra phát hiện gian lận ở chu kỳ tồn kho và lưu kho

và Owusu-Ansah và cộng sự (2002) sử dụng quá

trình khai phá quy trình kinh doanh để giảm thiểu

các rủi ro gian lận nội bộ của các giao dịch trong

quá trình mua hàng. Các tác giả này thấy rằng quy

mô của kiểm toán, nhiệm kỳ của kiểm toán viên, và

năm kinh nghiệm của kiểm toán viên là yếu tố dự

báo về gian lận về mặt thống kê. Sử dụng một sự kết

hợp của Luật Benford và các mạng thần kinh, Busta

và Weinberg (1998) tập trung vào việc phát hiện dữ

liệu tài chính bị thao túng thông qua thủ tục phân

tích; Kim và Vasarhelyi (2012) đã sử dụng khai phá

dữ liệu để phát hiện gian lận nội bộ ở cấp công ty.

sự trợ giúp của việc khai phá dữ liệu ở các cấp khác

nhau: dựa trên gian lận của nhà quản lý cấp cao

(Fanning và Cogger, 1998, Pai và cộng sự, 2011),

phát hiện gian lận dựa trên dự đoán về kết quả hoạt

động trong tương lại của công ty (Virdhagriswaran

và Dakin, 2006) và phát hiện gian lận trong các

báo cáo tài chính (Kirkos và cộng sự, 2007; Perols,

2011). Các kết luận quan trọng của các tác giả này

bao gồm: khả năng của các mô hình mạng thần

kinh phân loại thành viên trong các cơ sở nghiên

cứu SEC so với các cơ sở không điều tra với độ

chính xác cao. Một giải thích cho thành công tương

đối của mạng nơron là khả năng sử dụng các quy

trình học tập thích ứng để xác định điều gì là quan

trọng để phân biệt “tín hiệu” thực từ các tín hiệu

nhiễu. Các nghiên cứu cũng khảo sát hiệu quả của

việc kết hợp các chỉ số tài chính và quản trị, các

yếu tố ngoại sinh và nội sinh và lựa chọn tính năng

để phát hiện các báo cáo tài chính sai lệch. eo

dòng nghiên cứu, nghiên cứu của Gaganis (2009)

liên quan đến việc sử dụng các kỹ thuật phân loại

khai phá dữ liệu kết hợp cả dữ liệu tài chính và phi

tài chính cho xác định FFS và kết luận rằng sự phân

loại chính xác phụ thuộc vào cách dữ liệu được xử

lý trước, chức năng khách quan, và chiến lược tìm

kiếm của mô hình. Alden và cộng sự (2012) đã sử

“Quản trị” gian lận là một loại hình gian lận

có ảnh hưởng xấu đến các bên liên quan thông qua

các báo cáo tài chính gây hiểu nhầm hoặc gian lận

(FFS) (Elliott và Willingham, 1980). Do đó, nhiều

nhà nghiên cứu tập trung vào việc phát hiện FFS với

NGHIÊN CỨU KHOA HỌC KIỂM TOÁN Số 119 - tháng 9/2017 35

NGHIEÂN CÖÙU TRAO ÑOÅI

dụng các thuật toán di truyền để phát hiện các mẫu

FFS và kết luận rằng ước lượng thuật toán phân

phối cho thấy khả năng phân loại mô hình gian lận

tài chính tốt hơn so với mô hình hồi quy xác suất

truyền thống. Cụ thể hơn, Lin và cộng sự (2003)

đã phát triển mô hình mạng nơ ron tích hợp để

đánh giá nguy cơ FFS. Mô hình mạng thần kinh

mờ của Lin và cộng sự (2003) đã vượt trội hơn hầu

hết các mô hình thống kê và mạng thần kinh khớp

thần kinh được báo cáo trong các nghiên cứu trước

và hiệu quả của nó so với mô hình hồi quy logit.

Liou (2008) đã khám phá ra sự khác biệt và tương

đồng giữa phát hiện báo cáo tài chính giả mạo và

các mô hình dự báo thất bại kinh doanh bằng cách

sử dụng hồi quy logistic, mạng nơ ron và cây quyết

định và nhận thấy rằng các yếu tố tài chính được sử

dụng để phát hiện các báo cáo gian lận là hữu ích

trong dự báo thất bại kinh doanh. Welch và cộng

sự (1998) đã phát triển một hệ thống phân loại dựa

trên khai phá dữ liệu để xây dựng mô hình quyết

định của kiểm toán viên khi ước tính khả năng

gian lận bởi các nhà thầu phát triển hồ sơ thầu

cho các hợp đồng của Chính phủ và báo cáo rằng

trong các mô hình quyết định phân loại liên quan

đến chế biến, sản xuất các mô hình cải tiến khi so

sánh với các phương pháp toán học truyền thống.

Kochetovakozloski và cộng sự (2011) đã sử dụng

khai phá dữ liệu để cải thiện xét đoán của kiểm

toán viên về các sự kiện “quản trị” gian lận.

nhuận và đặt câu hỏi về giả thiết tuyến tính cho

việc mô hình biến kế toán dồn tích tùy ý và kết luận

rằng một cách tiếp cận phi tuyến tính để dự đoán

việc quản trị lợi nhuận hiệu quả hơn phương pháp

tuyến tính. Tập trung vào việc phát hiện quản trị lợi

nhuận, Jones (1991) đưa ra mô hình tích lũy bằng

cách sử dụng một thuật toán di truyền. Kết quả cho

thấy sự vượt trội của các thuật toán di truyền so

với các phương pháp phân cụm. Để giải quyết vấn

đề số liệu sẵn có trong ước tính chuỗi thời gian,

Hoglund (2013) nhận thấy mô hình Jones dựa trên

hồi quy tuyến tính mờ tốt hơn mô hình Jones dựa

trên hồi quy trong việc phát hiện quản trị lợi nhuận

được mô tả khi các chuỗi thời gian ước lượng ngắn.

Song và cộng sự (2013) đã kiểm tra mối liên quan

giữa quản trị lợi nhuận và khai khống tài sản và

phát hiện ra rằng việc khai khống tài sản có mối

liên quan đáng kể với biến kế toán dồn tích tùy ý.

Tóm lại, các ứng dụng khai phá dữ liệu trong

kiểm toán và dịch vụ đảm bảo tập trung chủ yếu

vào hai chủ đề chính: kiểm toán (bao gồm các giai

đoạn ký kết, lập kế hoạch, thực hiện và sau kiểm

toán) và kế toán điều tra (phát hiện gian lận và

quản trị lợi nhuận). Mục tiêu chính của các ứng

dụng trong lĩnh vực này là dự đoán và nhiệm vụ

chính là phân loại. Các kỹ thuật nổi trội là các

mạng nơ-ron và hồi quy. Các cơ hội nghiên cứu

trong tương lai bao gồm: tăng các dữ liệu đầu vào

với các biến số liên quan đến đặc điểm quản trị, thử

nghiệm các cách tiếp cận khác nhau để kết hợp các

cách phân loại, kiểm tra các thuật toán học khác

nhau và các mô hình cấu trúc, khám phá các thời

gian khác nhau và các phương pháp tiền xử lý dữ

liệu, mở rộng phạm vi phát triển mô hình tới nhiều

loại hình kinh doanh và nhiều lựa chọn hơn, tăng

thời gian dự đoán bao gồm các biến phi tài chính

và phân tích trực quan hơn, chú ý nhiều hơn đến so

sánh mô hình, chuẩn hóa dữ liệu và khai phá văn

bản trong dự báo gian lận tài chính.

Hành vi điều chỉnh lợi nhuận

Trong lĩnh vực tiên đoán về quản trị lợi nhuận,

Tsai và Chiou (2009) đã phát triển mạng lưới thần

kinh và các mô hình cây quyết định để các nhà đầu

tư sử dụng để dự đoán mức độ quản trị lợi nhuận

trước đó và đánh giá mức độ tăng giảm của lợi

nhuận sau đó. Kết quả của Tsai và Chiou (2009)

chỉ ra rằng sử dụng các kỹ thuật khai phá dữ liệu đã

làm tăng đáng kể dự báo về quản trị lợi nhuận và

các quy tắc ra quyết định giúp xác định việc quản

trị lợi nhuận. Mặt khác, Ezazi và cộng sự (2013)

đã kiểm tra tính hữu dụng của các kỹ thuật khai

phá dữ liệu khác nhau trong dự đoán quản trị lợi

4. kết luận

Bài viết tổng quan các nghiên cứu liên quan

đến ứng dụng khai phá dữ liệu trong lĩnh vực kiểm

36 Số 119 - tháng 9/2017 NGHIÊN CỨU KHOA HỌC KIỂM TOÁN

7 trang yennguyen 19/04/2022 1120

Download

Bạn đang xem tài liệu "Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

File đính kèm:

vai_tro_cua_khai_pha_du_lieu_trong_linh_vuc_kiem_toan_va_dic.pdf