Tải bản đầy đủ - 0 (trang)
2 Thách thc, muc tiêu và pham vi

2 Thách thc, muc tiêu và pham vi

Tải bản đầy đủ - 0trang

Chương 1. Tổng quan



• DL là một xu hướng mới đang được quan tâm nghiên cứu. Đặc biệt với khả

năng tự học và đưa ra các đặc trưng trong các bài tốn nhận diện ảnh.

• Việc áp dụng DL vào bài toán phát hiện sự kiện trong video đang ở bước

sơ khởi. Đây là hướng nghiên cứu tiềm năng và còn nhiều cơ hội cho các

nhóm mới bắt đầu.

• Đối với cộng đồng nghiên cứu trong nước thì DL vẫn lĩnh vực mới - chưa

có tài liệu tiếng việt giới thiệu về DL, cũng như bài toán phát hiện sự kiện

trong video chưa có nhiều nghiên cứu.

Tính cấp thiết:

• Phát hiện, nhận dạng và phân loại sự kiện có nhiều ứng dụng thực tế, đặc

biệt là trong lĩnh vực an ninh nơi cơng cộng, hỗ trợ chăm sóc người già

và trẻ em. Bài tốn phát hiện cảnh bạo lực có tính ứng dụng cao đặc biệt

trong thời đạị bùng nổ về dữ liệu video trên internet.

• DL đang là một xu hướng mới được cộng đồng nghiên cứu trên thế giới

đặc biệt quan tâm. Với các kết quả vượt trội so với các nghiên cứu trước

đây cũng như nhiều ứng dụng đã đưa vào thực tế thì DL cần được đầu tư

nghiên cứu. Ngoài ra, DL bao gồm nhiều thuật tốn, do đó việc thực hiện

tìm hiểu tổng quan các thuật toán cũng như cách sử dụng các thư viện DL

sẽ giúp đánh giá, lựa chọn được một thuật toán cụ thể để giải quyết yêu

cầu đặt ra.



1.2.3



Mục tiêu và phạm vi



Mục tiêu:

Luận văn “Ứng dụng Deep Learning cho bài tốn phát hiện sự kiện trong dữ

liệu video” có mục tiêu chính sau dây:



(a) Tìm hiểu tổng quan bài tốn phát hiện sự kiện trong video. Cụ thể hơn ở

đây là bài toán phát hiện cảnh bạo lực trong video.



5



Chương 1. Tổng quan



(b) Nghiên cứu DL và các kiến thức liên quan đến các thuật toán được sử dụng

trong xử lý ảnh.

(c) Từ những kiến thức tìm hiểu được đề xuất phương pháp áp dụng DL làm

tăng độ chính xác cho bài toán phát phát hiện cảnh bạo lực trong video.

Với những mục tiêu trên học viên sẽ thực hiện các công việc cụ thể sau:

1. Nghiên cứu và khảo sát bài toán phát hiện cảnh bạo lực trong video.

2. Tìm hiểu tổng quan kĩ thuật DL, hệ thống lại các kiến thức cơ sở của thuật

toán DL. Giới thiệu về Convolutional Neural Networks (CNN) - thuật toán

hiện cho kết quả cao nhất về độ chính xác trên các bài toán về thị giác máy.

3. Đề xuất sử dụng đặc trưng được rút ra từ các mơ hình DL hay còn gọi là

Deep Feature (DF) vào bài tốn VSD. Thực hiện việc đánh giá và so sánh

trên tập dữ liệu chuẩn được cộng đồng nghiên cứu bài toán trên thế giới sử

dụng.

Phạm vi:



• Nghiên cứu trên bài tốn phát hiện cảnh bạo lực trong video (Violent Scenes

Detection -VSD) - đây cũng là một dạng sự kiện trong lớp các bài tốn về

phát hiện sự kiện trong video MED.

• Hệ thống lại các kiến thức cơ sở của thuật toán DL và các nghiên cứu liên

quan cũng như trình bày kiến thức về CNN.

• Tiến hành thực nghiệm và đánh giá đề xuất trên tập dữ liệu chuẩn của cuộc

thi VSD-2014 (Media Eval – Violent Scene Detection dataset [12]).



1.3



Cấu trúc luận văn



Trong chương 1 học viên đã giới thiệu động lực nghiên cứu cũng như mục tiêu

và phạm vi trong luận văn này. Các nội dung sẽ được trình bày trong các chương

tiếp theo có cấu trúc như sau:



6



Chương 1. Tổng quan



• Chương 2 có nội dung giới thiệu bài tốn phát hiện cảnh bạo lực trong

video và các hướng nghiên cứu liên quan.

• Trong chương 3 học viên sẽ giới thiệu kiến thức tổng quan về DL, một số

kiến thức và lý thuyết cơ sở được sử dụng. Nội dung chính của chương sẽ

giới thiệu thuật tốn CNN và một số nghiên cứu liên quan đến việc sử dụng

DL trong việc giải quyết các bài tốn về thị giác máy.

• Chương 4 sẽ giới thiệu việc áp dụng DL vào giải quyết bài toán VSD. Trong

nội dung của chương này cũng sẽ tiến hành các đánh giá phương pháp đề

xuất trên tập dữ liệu chuẩn của bài toán VSD. Theo đó, học viên sẽ trình

bày chi tiết về các bộ dữ liệu, việc cài đặt thí nghiệm và kết quả thí nghiệm.

• Nội dung trong chương 5, học viên sẽ tổng kết về luận văn, bàn luận thêm

về phương pháp đề xuất và hướng cải tiến, mở rộng để nâng cao hiệu suất

của hệ thống trong thời gian tới.



7



Chương 2

Bài tốn phát hiện cảnh bạo lực

trong video

Nội dung chính của chương sẽ giới thiệu bài toán phát hiện cảnh bạo lực trong

video (VSD) - đây cũng là một dạng sự kiện trong lớp các bài toán về phát hiện

sự kiện trong video được lấy làm chủ đề nghiên cứu chính của luận văn. Phần nội

dung sẽ trình bày phát biểu bài toán và các hướng nghiên cứu liên quan.



2.1



Phát biểu bài toán



Ngày nay, Internet đã trở nên rất phổ biến, mọi người ở mọi lứa tuổi đều có

thể dễ dàng tiếp cận với các thơng tin mà mình quan tâm dưới nhiều hình thức

khác nhau như bằng văn bản, hình ảnh, âm thanh hoặc các đoạn video. Trong

đó video là một những phương thức trực quan với lượng dữ liệu rất lớn, được

chia sẻ trên nhiều kênh. Tuy nhiên, không phải tất cả các nội dung đều phù hợp

với mọi lứa tuổi đặc biệt là trẻ em. Đã có nhiều nghiên cứu cũng như dẫn chứng

đã chứng minh có sự ảnh hưởng giữa nội dung video đến hành vi của trẻ em

đặc biệt là các nội dung bạo lực [14]. Theo thống kê từ báo An ninh Thủ đơ thì

trong 6 tháng đầu năm 2011 có 15.000 vụ phạm pháp hình sự, xử lý trên 22.000

đối tượng, trong đó có hơn 75% tội phạm hình sự là thanh thiếu niên, bài báo

chỉ ra rằng một trong những nguyên nhân đó là sự tác động của việc quá nhiều

phim bạo lực cũng như các trò chơi trực tuyến có nội dung bạo lực tràn lan trên



8



2. Bài toán phát hiện cảnh bạo lực trong video



internet (hình 2.2).

Từ thực tế này bài toán phát hiện cảnh bạo lực trong video được đề xuất và

được mô tả như sau: đầu vào là video bất kì, đầu ra là các cảnh có chứa thơng

tin bạo lực (hình 2.3).



Hình 2.1: Thống kê cho thấy trong 6 tháng đầu năm 2011 có hơn 75% tội phạm

hình sự là thanh thiếu niên



Hình 2.2: Có sự ảnh hưởng của việc xem video có nội dung bạo lực đến hành vi

của trẻ em 2



2



http://anninhthudo.vn/phap-luat/75-toi-pham-hinh-su-la-nguoi-tre/420361.antd



9



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

2 Thách thc, muc tiêu và pham vi

Tải bản đầy đủ ngay(0 tr)

×