Tải bản đầy đủ - 0 (trang)
Hướng nghiên cứu tiếp theo

Hướng nghiên cứu tiếp theo

Tải bản đầy đủ - 0trang

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Nguyễn Minh Sơn - Dịch tễ học, Nhà xuất bản Giáo dục 2012.

Tiếng Anh

[2] Centers for Disease Control and Prevention (CDC USA) - Principles of

epidemiology in public health practice, Third edition 2012. 2

[3] Dorland - Dorland's Illustrated Medical Dictionary 32nd Edition, 2011.

[4] Chi-Chen Wang. “A comparision study between fuzzy time series model and

ARIMA model for forecasting Taiwan export”. Expert Systems with Applications,

vol.38, no.8, pp.9296-9304, 2011.

[5] Hippocrates - On airs, waters, and places written 400 B.C.E (Translated by

Francis Adams).

[6] Han, Jiawei, Jian Pei, and Micheline Kamber. Data mining: concepts and

techniques. Elsevier, 2011.

[7] K. Senthamarai Kannan and E. Sakthivel. “Fuzzy Time Series Model and

ARIMA Model – A Comparative Study”. Indian Journal of Applied Research, vol.4,

no.8, pp.624-636, 2014.

[8] LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. "Deep learning." Nature

521.7553 (2015): 436-444.

[9] R. Bonita, R. Beaglehole, Tord Kjellström - Basic epidemiology 2nd edition,

World Health Organization.

[10] Shasha, D., High Performance Discovery in Time Series, Berlin:

Springer, ISBN 0387008578, 2004.

[11] Verikas, Antanas, Adas Gelzinis, and Marija Bacauskiene. "Mining data

with random forests: A survey and results of new tests." Pattern Recognition 44.2

(2011): 330-349.

[12] https://www.cs.waikato.ac.nz

[13] https://www.spss-tutorials.com/spss-what-is-it

[14] https://www.r-project.org

[15] https://www.britannica.com/science/preventive-medicine.



46



PHỤ LỤC

1. Gọi thư viện: ggplot2, forecast, tseries, lubridate.

> library('ggplot2')

> library('forecast')

> library('tseries')

> library(lubridate)

2. Cài đặt thư viện:

> install.packages("lubridate")

3. Nạp tập dữ liệu:

> d<-read.csv("dataArgentina.csv", head=T)

>d

4. Trích xuất dữ liệu của một năm bất kỳ trong tập d với dữ liệu của năm

2004 của Argentina.

> Nam2004 <- d[format(as.Date(d$Date, format = '%m/%d/%Y'), '%Y')==2004,]

> Nam2004

5. Xây dựng sơ đồ diễn biến số liệu năm 2004 của Argentina.

> Nam2004$Date = as.Date(Nam2004$Date)

> ggplot(Nam2004, aes(Date, Argentina))+ geom_line()+ scale_x_date('month')+

ylab("Số ca mắc cúm")+xlab("thời gian")

6. Làm mịn tập dữ liệu:

> count_sc = ts(Nam2004[, c('Argentina')])

> Nam2004$clean_scm = tsclean(count_sc)

> Nam2004

7. Vẽ biểu đồ với tập dữ liệu Nam2004 sau khi được xử lý qua hàm tsclean():

> ggplot() + geom_line(data = Nam2004, aes(x = Date, y = clean_scm))

+ylab('Số ca mắc cúm (Cleaned)')

8. Lấy mức trung bình theo những khoảng thời gian, làm mịn để chuỗi trở

nên ổn định hơn và có thể dự đoán được:

> Nam2004$cnt_ma = ma(Nam2004$clean_scm, order=7) #sử dụng số tại cột

clean_scm đã được loại bỏ ngoại lệ

> Nam2004$cnt_ma30 = ma(Nam2004$clean_scm, order=30)

> ggplot() + geom_line(data = Nam2004, aes(x = Date, y = clean_scm, colour

47



="Counts")) + geom_line(data = Nam2004, aes(x = Date, y = cnt_ma30, colour = "Di

chuyển trượt hàng tháng")) + ylab('Số ca bệnh mắc')

9. Làm mịn và điều chỉnh chuỗi ban đầu bằng cách loại bỏ tính thời vụ:

> count_sm = ts(na.omit(Nam2004$cnt_ma), frequency=7)

> decomp = stl(count_sm, s.window="periodic")

> deseasonal_scm <- seasadj(decomp)

> plot(decomp)

10. Sử dụng ADF để kiểm tra tính dừng của chuỗi thời gian:

> adf.test(count_sm, alternative = "stationary")

11. Biểu diễn sơ đồ dữ liệu với ACF và PACF:

> Acf(count_sm, main='')

> Pacf(count_sm, main='')

12. Kiểm tra sơ đồ với d = 1:

> count_d1 = diff(deseasonal_scm, differences = 1)

> plot(count_d1)

> adf.test(count_d1, alternative = "stationary")

13. Biểu diễn sơ đồ dữ liệu với ACF và PACF với d = 1:

> Acf(count_d1, main='ACF for Differenced Series')

> Pacf(count_d1, main='PACF for Differenced Series')

14. Biểu diễn mơ hình ARIMA:

> auto.arima(deseasonal_scm, seasonal=FALSE)

> fit<-auto.arima(deseasonal_scm, seasonal=FALSE)

> tsdisplay(residuals(fit), lag.max=45, main='(1,1,1) Model Residuals')

> fit2 = arima(deseasonal_scm, order=c(1,1,7))

15. Biểu diễn mơ hình dự báo:

> fcast <- forecast(fit2, h=30)

> plot(fcast)



48



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Hướng nghiên cứu tiếp theo

Tải bản đầy đủ ngay(0 tr)

×