Tải bản đầy đủ - 0 (trang)
III. Giấu tin bằng mô hình sinh thơ lục bát

III. Giấu tin bằng mô hình sinh thơ lục bát

Tải bản đầy đủ - 0trang

a. Yêu cầu của bài toán

Yêu cầu đặt ra ở đây là giấu thông tin bằng một mô hình sinh nào đó. Ở

đây ta sử dụng mơ hình sinh ngơn ngữ. Như vậy, khi đưa vào một thông điệp thì

mô hình sẽ sinh ra một file văn bản mà nội dung file ẩn giấu (chứ không chứa)

thông điệp cần nhúng. Xuất phát từ đặc trưng của Steganography với mong

muốn che giấu đi sự tồn tại của tin được nhúng, đòi hỏi file được sinh ra ở trên

phải giả dạng được một dạng văn bản nào đó nhằm tránh đi sự nghi ngờ có thơng

tin ẩn trong q trình trùn file.

Ngược lại, khi nhận được file giấu, sử dụng mô hình đã dùng để sinh ta

phải lấy lại được thông điệp đã giấu.

Ngồi ra, đoạn văn bản giấu thơng tin có thể bị tấn công trong quá trình

truyền vì vậy vấn đề cần giải quyết là làm thế nào hạn chế được sự tấn cơng đó.

b. Phương pháp giấu tin bằng mô hình sinh ngôn ngữ

Đúng như tên của phương pháp, vấn đề cần nghiên cứu là sự kết hợp của

hai kỹ thuật: giấu tin và sinh ngôn ngữ bằng văn phạm. Đây cũng là hai kỹ thuật

khó đạt được giải pháp tối ưu và hiện còn rất nhiều vấn đề cần bàn đến.

Thực chất, phương pháp được xây dựng dựa trên sự đan xen các bước của

hai kỹ thuật trên và chia làm 2 quá trình:

+ Quá trình giấu:

- Xây dựng văn phạm sinh ngơn ngữ

- Mã hóa văn phạm

- Mã hóa thơng điệp cần trùn

- Sinh ngơn ngữ theo văn phạm và theo mã của thơng điệp



+ Q trình trích rút

- Lấy nội dung file chứa

- Dùng văn phạm để giải mã

- Giải mã thông điệp

2. Chọn loại văn bản cần sinh

a. Chọn thể thơ lục bát

Theo yêu cầu đặt ra, điều đáng quan tâm là tăng cường khả năng giả dạng

của file chứa thông điệp. Vì vậy ta cần xây dựng một văn phạm sản sinh ra ngôn

ngữ một cách tự nhiên nhất. Sinh ngôn ngữ tự nhiên bằng văn phạm đã rất khó

được tự nhiên, thêm sự ràng buộc của thông điệp giấu làm cho độ tự nhiên lại

càng giảm đi. Vậy nên ta sẽ không quá phức tạp khâu mã hóa văn phạm và thơng

điệp cần giấu.

Giải pháp cho vấn đề trên như sau:

Ta chọn xây dựng văn phạm sinh thơ lục bát. Lục bát là thể thơ truyền

thống của Việt Nam, một bài thơ lục bát là tập hợp của nhiều câu lục bát, mỗi

câu thường ngắt nhịp theo 2 tiếng, độ dài của bài thơ là không giới hạn. Điều

này thuận lợi cho việc xây dựng văn phạm, mã hóa văn phạm, có khả năng

chống tấn công, đặc điểm thể loại thơ (mức độ trừu tượng của ngữ nghĩa, tính

chất vần điệu chặt chẽ) còn hạn chế được sự nghi ngờ do vẫn còn sự ngô nghê

của câu chữ.

b. Về thể thơ lục bát

- Về số câu chữ



Một bài thơ lục bát là tập hợp của các câu thơ lục bát, một câu lục bát gồm

câu lục (6 tiếng) và câu bát (8 tiếng). Trong câu thơ nhịp thường được ngắt theo

2 tiếng (nhịp chẵn). Cũng có trường hợp ngoại lệ mỗi nhịp là 3 tiếng ( với câu 6)

và 4 tiếng (với câu 8).

- Gieo vần phối điệu

Thể thơ lục bát có cước vận và yêu vận, tức là vừa gieo vần chấn, vừa gieo

vần lưng. Tiếng cuối của câu lục gieo vần xuống tiếng 6 của câu bát, tiếng cuối

của câu bát lại gieo vần xuống tiếng 6 của câu lục tiếp theo.

Về phối điệu thơ lục bát có các luật “Nhất tam ngũ bất luận, nhị tứ lục

phân minh” tức là các tiếng lẻ thì gì cũng được nhưng với các tiếng chẵn phải

tuân theo đúng niêm luật.

Luật phối điệu như sau:



O



O



B



O



T



O



B



B



O



T



O



B



O



B



Trong đó:

B : Thanh bằng

T : Thanh trắc

O : Thanh tự do ( bằng hoặc trắc)

Ngồi ra còn có luật trầm bổng, tức là tiếng thứ 6 và tiếng thứ 8 của câu

bát mặc dù đều là thanh bằng nhưng có sự chuyển đởi từ âm trầm (hùn) sang

âm bởng (không).



Luật gieo vần và phối điệu trên làm cho bài thơ lục bát nhịp nhàng chặt

chẽ.

c. Văn phạm sinh thơ lục bát

Văn phạm được xây dựng có dạng văn phạm phi ngữ cảnh.

Giả sử gọi văn phạm là GLB = (N,T,P,k) thì :

k: ký tự bắt đầu là thể thơ lục bát

N tập các biến:

Ta thấy một bài thơ lục bát là một chuỗi các câu lục bát, mỗi câu lục bát

lại gồm 1 câu lục và 1 câu bát.

STT

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20



Tên biến

Thơ lục bát

Câu 1

Câu tiếp theo

Câu 2

Câu lục 1

Câu lục 2

Câu bát 1

Câu bát 2

Nhịp bằng

Nhịp trắc

Nhịp sáu 1

Nhịp sáu 2

Nhịp tám 1



Ký hiệu

K

C1

CT

C2

CL1

CL2

CB1

CB2

NB

NT

NS1

NS2

NT1



Nhịp tám 2

Nhịp tám 3

Tiếng sáu 1

Tiếng sáu 2

Tiếng tám 1

Tiếng tám 2

Tiếng tám 3



NT2

NT3

TS1

TS2

TT1

TT2

TT3



STT

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36



Tên biến

Vần

Vần 1

Vần 2

Tiếng

Tiếng bằng

Tiếng trắc

Thanh bằng

Thanh trắc

Thanh tám 1

Thanh tám 2

Phép toán

Đảo thanh

Phụ âm

Phụ âm đầu

Phụ âm cuối

Nguyên âm



Ký hiệu

V0

V1

V2

TG

TB

TT

THB

THT

TH3

TH4

PT

DT

PA

PAD

PAC

NA



T là tập các ký tự kết thúc: tập thanh âm (không, huyền, ngã ,hỏi, sắc,

nặng), tập các vần, nguyên âm, phụ âm …

P : tập luật

1







2







3







4







5







6







7







8







9











10







11







12







13







14







15







16







17







18







19







20







21







22







23







24







25







26







27







28







29







30



 {Huyền, Không}



32



 {Sắc, Hỏi, Ngã, Nặng}



33



 {Huyền} {Không} {Không}



34



{Huyền}

 {=}



35



< NA>  {Tập nguyên âm}



36



 {Tập phụ âm đầu}



37



 {Tập phụ âm cuối}



Tập nguyên âm : {a, ă, â, e, ê, i, o, ô, ơ, u, ư, y,

ai, ao, au, ay, âu, ây, eo, êu, ia, iê, iu, oa, oi, oe, oă,

oo, ôi, ơi, ua, uâ, uă, uê, uô, ui, uy, ưa, ưi, ươ, ưu, yê, iêu, oai,

oao, oay, oeo, uôi, uây, uyê, ươi, ươu, uya, uyu, yêu }

Tập phụ âm đầu : {b, d, đ, g, h, k, l, r, s, v, x, gh, gi, kh, ph, qu, th, tr, ngh}

Tập phụ âm cuối: {c, p, t, m, n, ch, ng, nh}

Như vậy thơ lục bát (k) là tập dẫn xuất của các câu lục bát liên tiếp. Ngôn

ngữ sinh bởi văn phạm này chính là tập các bài thơ lục bát dẫn xuất từ k

L(GLB)={w | w  T và k *  w }



4. Giấu tin bằng thơ lục bát

Ta đã có được văn phạm sinh thơ, bây giờ sẽ tìm cách giấu thông tin vào

thơ qua quá trình sinh đó. Dưới đây là một số phương pháp giấu tin vào thơ, các

phương pháp chủ yếu dựa vào tập T và sự khác nhau của các phương pháp này

cũng bởi các cách xây dựng tập T khác nhau.

a. Phương pháp 1

Trong phương pháp này ta sẽ lấy từ để xây dựng thơ theo tập luật P.

Khi xem xét tiếng Việt dưới góc độ Cơng nghệ thơng tin ta thấy mọi từ

trong tiếng Việt có cấu trúc như sau:

[] &



Trong đó thành phần có thể có hoặc khơng, thành phần

bắt buộc phải có. [7]

Dựa vào nguyên âm bắt buộc phải có, nguyên âm được chia làm 4 loại

tương ứng với độ dài nguyên âm là 1, 2, 3, 4. [7]

Ở đây là dựa vào độ dài các nguyên âm (vần) sẽ cấu tạo nên từ trong quá

trình sinh. Tức là khi sinh văn bản, cùng với luật sinh thì việc lấy vần của từ cần

đưa vào (theo độ dài vần) phải phù hợp với mã đưa vào của thông tin giấu đã

được mã hóa. Lấy độ dài nào theo mã nào sẽ được quy định trong luật mã hóa,

luật này đặt ra cho tập T.

Có nhiều cách để mã hóa trong phương pháp này, mỗi cách có thể coi là

một luật và tương ứng với một hàm nhất định nào đó, với các biến là các thành

phần của văn phạm sẽ được dùng để quy ra mã dạng bít.

Dưới đây tơi chỉ nêu lên một trường hợp, với hàm có dạng

f(n)=αn

chọn tham số α = 4 tương ứng với 4 loại vần.

Khi đó n thay đởi thì việc mã hóa sẽ khác nhau (ta tạm thời chọn với 4

dạng bít với độ dài là 2), ví dụ:

Với n = 1, thì 4 loại độ dài nguyên âm (vần) sẽ tương ứng với 4 dạng bít

00, 01, 10, 11

Với n = 2 thì, độ dài vần của 2 từ liên tiếp so với một dạng mã sẽ là : 00 –

11, 12, 13, 14; 01 – 21, 22, 23, 24; 10 – 31, 32, 33, 34; 11 – 41, 42, 43 ,44.

Tức là nếu 2 bít của tin là 00 thì nhịp đó có thể lấy hai tiếng có độ dài vần

lần lượt là 1 và 1, 1 và 2 , 1 và 4 hoặc 1 và 4.



Với n  3 tương tự, tuy nhiên phải xét nhiều trường hợp hơn.

b. Phương pháp 2

Phương pháp này ta lấy từng nhịp để đưa vào thơ, vậy nên việc tổ chức tập

T cũng khác đi. Tập T sẽ là một tập các nhịp được xây dựng sẵn (sử dụng từ điển

từ) với đủ các thuộc tính.

Còn về mã hóa tập từ này:

u cầu mã hóa đòi hỏi: khi mã hóa một chuỗi bít bất kỳ vẫn thỏa mãn

yêu các cầu sinh thơ. Tức là cùng một dạng từ (cùng vần, số tiếng, loại từ, chủ

đề, thanh) phải mã hóa được hết các giá trị dưới dạng chuỗi bít nhị phân theo độ

dài nhất định. Như vậy yêu cầu văn phạm phải phong phú về bộ từ. Ở đây ta

chọn độ dài chuỗi bít là 2, tức là phải có 4 từ cùng một dạng nào đó.

Ví dụ, khi cần lấy đến nhịp 3, phải có vần “a”, phải lấy thanh “hùn”

nhưng mã bít của thơng điệp đưa vào lúc thì là 00, lúc thì 01, 10, 11, vậy thì

trong từ điển phải có ít nhất 4 từ khác nhau cùng vần “a”, cùng thanh “huyền”

khác nhau về mã 2 bít để có thể đưa vào được nhịp 3.

5. Tấn công và chống tấn công

a. Tấn công

Việc tấn công vào thông tin ẩn gọi là Steganalysis. Steganalysis được chia

làm 2 nội dung: kiểu tấn công chỉ phát hiện ra thơng tin ẩn, kiểu tấn cơng bóp

méo thơng tin ẩn (khi đã phát hiện hoặc có thể chưa phát hiện ra).

Cơng việc dò tìm phát hiện chủ yếu dựa vào việc phân tích chất lượng file

và so sánh kích thước file với file gốc. Còn bóp méo thì đa dạng hơn, chỉ là thay

đổi nội dung một phần hay toàn bộ file theo nhiều cách khác nhau. Nhiều khi

còn là hủy hẳn file bị nghi ngờ đi.



b. Chống tấn công

Đặc trưng của phương pháp giấu tin bằng mô hình sinh đã hạn chế được

rất nhiều việc tấn cơng bởi file được sinh ra là hồn tồn mới. Kẻ tấn cơng sẽ

khơng có file gốc để so sánh về chất lượng cũng như kích thước file.

Khả năng chống tấn cơng của phương pháp này còn thể hiện ở chỗ nội

dung thông điệp không nằm trong nội dung vật lý của file nên việc bóp méo file

bị ảnh hưởng ít hơn.

Dựa vào đặc trưng của thơ lục bát (độ dài bài thơ là không hạn chế không gian giấu là khơng hạn chế, có thể chia khở) ta có thể lặp lại tin giấu trong

nhiều khổ. Như vậy việc tấn công vào một phần file văn bản sẽ không thể làm

mất hẳn tin giấu. Tuy vậy hai khổ thơ có thể cùng một mẩu thơng điệp nhưng nội

dung bề ngoài là phải hoàn toàn khác nhau.

Ngoài ra, kỹ thuật sinh ngôn ngữ càng tốt thì khả năng giả dạng càng cao,

tức khả năng chống phát hiện càng cao. Đây có lẽ là biện pháp quan trọng nhất.

Hai phương pháp nêu trên cũng xuất phát từ nhu cầu tăng khả năng giả dạng, tức

nhu cầu tăng về độ tự nhiên của bài thơ.

6. Nhận xét đánh giá thực nghiệm

a. Kết quả

Kết quả chung là đều đã giấu tin được thông qua các bài thơ lục bát và lấy

lại được tin từ các bài thơ đó. Phục vụ mục đích chống tấn cơng, các bài thơ đều

được chia khở và có khả năng lặp lại nhiều lần thông điệp giấu, độ dài khở có thể

thay đởi, khi lấy lại thơng điệp nếu file bị thay đởi một vài phần vẫn có thể lấy

lại được tin gốc. Cùng một tin giấu có thể đưa ra hai bài thơ khác nhau.

b. Nhận xét và đánh giá



So với các phương pháp chèn và thay thế, phương pháp này có khơng gian

lưu trữ lớn hơn, khả năng bền vững cao hơn nhưng lại dễ bị phát hiện hơn do độ

tự nhiên của file thơ chỉ là tương đối. Đây cũng là điểm yếu chung của phương

pháp giấu tin bằng mô hình sinh.

So sánh 2 phương pháp đã nêu, phương pháp 1 đa dạng hơn về phương

pháp mã hóa và giấu tin nhưng độ tự nhiên của thơ còn kém. Phương pháp 2, độ

giả dạng của thơ tốt hơn nhiều, nhưng việc mã hóa cũng chỉ đơn giản là mã hóa

bộ từ điển và bộ từ điển phải phong phú.

IV Kết luận

Bài báo trình bày một nghiên cứu mới trong lĩnh vực giấu tin phục vụ cho

cơng tác đảm bảo an tồn thơng tin:

Nghiên cứu một số phương pháp giấu tin bằng mô hình sinh thơ lục bát,

thử nghiệm kết quả và nhận xét đánh giá các phương pháp. Xem xét các khả

năng tấn công và đề xuất giải pháp chống tấn công hiệu quả.



V. TÀI LIỆU THAM KHẢO

[1]



Peter Wayner, “Disappearing Cryptography – Information Hiding:



Steganography & Watermarking”, Morgan Kaufmann(MK) Publishers, 2002

[2]



Eric Cole, Ronald D. Krutz, Consulting Editor, “Hiding in Plain Sight:



Steganography and the Art of Covert Communication ”, Wiley, Inc, 2003

[3]



Neil F. Jonhson, Zoran Duric, Sushil Jajodia – Center for Secure



Information



Systems



George



Mason



University



“Information



Hiding:



Steganography and Watermarking-Attacks and Countermeasures”, Kluwer

Academic Publishers, 2001



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

III. Giấu tin bằng mô hình sinh thơ lục bát

Tải bản đầy đủ ngay(0 tr)

×