Open Access. Powered by Scholars. Published by Universities.®

Physical Sciences and Mathematics Commons

Open Access. Powered by Scholars. Published by Universities.®

Statistics and Probability

Institution
Keyword
Publication Year
Publication
Publication Type
File Type

Articles 1471 - 1500 of 13261

Full-Text Articles in Physical Sciences and Mathematics

การศึกษาเปรียบเทียบตัวแบบจำลองการถดถอยโดยความไม่แน่นอนเพื่อลดเวลาในกระบวนการทดสอบวัดค่ากระแสไฟฟ้าเขียนที่เหมาะสมที่สุดของฮาร์ดไดรฟ์, ภัทรดิศ ดำรงค์ศักดิ์ Jan 2022

การศึกษาเปรียบเทียบตัวแบบจำลองการถดถอยโดยความไม่แน่นอนเพื่อลดเวลาในกระบวนการทดสอบวัดค่ากระแสไฟฟ้าเขียนที่เหมาะสมที่สุดของฮาร์ดไดรฟ์, ภัทรดิศ ดำรงค์ศักดิ์

Chulalongkorn University Theses and Dissertations (Chula ETD)

ฮาร์ดไดรฟ์ (HDD) เป็นอุปกรณ์บันทึกข้อมูลแม่เหล็กที่มีความแม่นยำสูง ดังนั้นจึงมีค่าใช้จ่ายสูง และเสียเวลาในการวัดค่ากระแสไฟฟ้าเขียนที่เหมาะสมที่สุดฮาร์ดไดรฟ์ หากจ่ายกระแสไฟฟ้าเขียนไม่เหมาะสมจะส่งผลกระทบต่อประสิทธิภาพการทำงานของฮาร์ดไดรฟ์ ซึ่งเราใช้วิธีการเงื่อนไขการทดสอบแบบปรับตัว (Adaptive Test Condition) เป็นเทคนิคที่ปรับวิธีการทดสอบแบบดั้งเดิม ตามรูปแบบข้อมูลพารามิเตอร์ เพื่อปรับปรุงวิธีการทดสอบปัจจุบัน และลดเวลาการทดสอบ งานวิทยานิพนธ์นี้มีวัตถุประสงค์เพื่อศึกษาและเปรียบเทียบวิธีการใช้ตัวแบบจำลองการถดถอยโดยความไม่แน่นอนสำหรับการลดช่วงการวัดค่ากระไฟฟ้าเขียนที่เหมาะสมที่สุด สำหรับการลดเวลาการทดสอบวัคค่ากระแสไฟฟ้าเขียน (write current test) โดยการคำนวณช่วงความเชื่อมั่นของผลทำนายที่ระดับความเชื่อมั่นที่ยอมรับได้ โดยใช้ค่าความไม่แน่นอนของข้อมูล (Data uncertainty) ที่ผ่านวิธีปรับการเทียบมาตรฐาน (Recalibration) แล้วนำมาลดช่วงวัดที่ได้จากการทดสอบฮาร์ดไดรฟ์ จากนั้นนำช่วงเชื่อมั่นของผลทำนายนั้นมาลดช่วงการวัดค่ากระแสไฟฟ้าเขียน โดยการศึกษา และเปรียบเทียบใช้ตัวแบบจำลองการถดถอยโดยความไม่แน่นอน ได้แก่ NGBoost, XGB-Distribution และ CatBoost ซึ่งผลลัพธ์ของงานวิทยานิพนธ์คือ CatBoost สามารถลดเวลาในการทดสอบวัคค่ากระแสไฟฟ้าเขียนสูงสุดที่ช่วงความเชื่อมั่นของผลทำนาย ณ ระดับความเชื่อมั่นที่ยอมรับได้ ซึ่งครอบคลุมสัดส่วน 0.9 ของทุกชุดการทดสอบ


การวิเคราะห์ความคงทนของตัวแบบการเรียนรู้เชิงลึกต่อการโจมตีแบบพอยซันนิ่งแบบแกนส์ในงานภาพทางการแพทย์, ภาคภูมิ สิงขรภูมิ Jan 2022

การวิเคราะห์ความคงทนของตัวแบบการเรียนรู้เชิงลึกต่อการโจมตีแบบพอยซันนิ่งแบบแกนส์ในงานภาพทางการแพทย์, ภาคภูมิ สิงขรภูมิ

Chulalongkorn University Theses and Dissertations (Chula ETD)

ปัจจุบันเทคโนโลยี deep learning ได้เข้ามีส่วนช่วยในการพัฒนางานทางด้านการแพทย์และสาธารณสุขเป็นอย่างมาก ด้วยการใช้สถาปัตยกรรมที่ล้ำสมัยและพารามิเตอร์ที่ถูกสอนด้วยข้อมูลขนาดใหญ่ แต่ทว่า model เหล่านี้สามารถถูกโจมตีได้ด้วย adversarial attack เพราะว่า model เหล่านี้ยังต้องพึ่งพารามิเตอร์ในการสร้างเอาต์พุตและลักษณะที่ไม่สามารถอธิบายได้ของ model นั้นก็ทำให้ยากที่จะหาทางแก้หากถูกโจมตีแล้ว ในทุกๆวันมีการใช้ model เหล่านี้เยอะมากขึ้นเพื่อช่วยบุคลากรทางการแพทย์ แต่ด้วยงานที่ต้องคำนึงถึงชีวิตของผู้คนเป็นหลักการทดสอบความปลอดภัยและความคงทนของตัว model จึงจำเป็น การโจมตีสามารถแบ่งได้ออกเป็นสองประเภทคือ evasion atttack และ poisoning attack ที่มีความยืดหยุ่นกว่า evasion attack ทั้งในเรื่องของการสร้างข้อมูลแปลกปลอมใหม่ขึ้นมาและวิธีการโจมตีทำให้การทดสอบความคงทนต่อ poisoning attack ในงานทางการแพทย์นั้นสำคัญเป็นอย่างยิ่ง วิทยานิพนธ์ฉบับนี้ศึกษาความคงทนของ deep learning model ที่มีสถาปัตยกรรมล้ำสมัยที่ถูกพัฒนามาเพื่องานจำแนกภาพเอกซเรย์ปอดแบบไบนารีภายใต้การโจมตีแบบ poisoninng attack การโจมตีนั้นจะใช้ GANs ในการสร้างข้อมูลสังเคราะห์ปลอมขึ้นมาและทำการติดป้ายกำกับที่ผิดให้ในรูปแบบของ black box และใช้ปริมาณของตัววัดที่ลดลงเมื่อนำข้อมูลนี้ไปอัพเดท model เป็นตัวบ่งชี้ถึงคความคงทนของแต่ละสถาปัตยกรรมที่่แตกต่างกันออกไป จากการทดลองเราพบว่าสถาปัตยกรรม ConvNext นั้นมีความคงทนมากที่สุดและอาจจะสื่อได้ว่าเทคโนโลยีที่มาจาก Transformer นั้นมีส่วนช่วยสนับสนุนความคงทนของ model


การเปรียบเทียบวิธีการคัดเลือกตัวแปรสำหรับการถดถอยโลจิสติกในข้อมูลที่มีมิติสูง, รัชพงศ์ ปรัชญาเศรษฐ Jan 2022

การเปรียบเทียบวิธีการคัดเลือกตัวแปรสำหรับการถดถอยโลจิสติกในข้อมูลที่มีมิติสูง, รัชพงศ์ ปรัชญาเศรษฐ

Chulalongkorn University Theses and Dissertations (Chula ETD)

Regularization เป็นวิธีการป้องกันปัญหา overfitting ด้วยการเพิ่มฟังก์ชันการลงโทษไปในตัวแบบเพื่อให้เกิดการคัดกรองตัวแปรเข้าสู่ตัวแบบ งานวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาและเปรียบเทียบประสิทธิภาพของวิธีการคัดกรองตัวแปรสำหรับการวิเคราะห์การถดถอยโลจิสติกในข้อมูลที่มีมิติสูง ด้วยการใช้ฟังก์ชันการลงโทษในรูปแบบ (1) L0-regularization (2) L1-regularization (3) L0L2-regularization การวิจัยนี้ใช้การจำลองข้อมูลเพื่อทำการทดสอบ 18 กรณี โดยกำหนดค่าที่ต่างกันประกอบด้วย จำนวนตัวแปรอิสระมีจำนวน 200, 500 และ 1000 ตัวแปร ความสัมพันธ์ของตัวแปรอิสระมีค่าเท่ากับ 0, 0.5 และ 0.9 อัตราส่วนสัญญาณต่อสัญญาณรบกวนมีค่าเท่ากับ 1 และ 6 โดยจำลองข้อมูลแต่ละกรณีจำนวน 100 ชุด ในการศึกษานี้มุ่งเน้นที่การเปรียบเทียบประสิทธิภาพในการคัดกรองตัวแปรของตัวแบบ และประสิทธิภาพในการทำนายของตัวแบบ ซึ่งเปรียบเทียบประสิทธิภาพในแต่ละวิธีด้วย ความผิดพลาดในการตรวจจับเชิงบวก ค่าเฉลี่ยแบบฮาร์โมนิคของค่าความแม่นยำและค่าความไว และ พื้นที่ใต้เส้นโค้ง จากการศึกษาพบว่าวิธี L0 มีความแม่นยำในการคัดกรองตัวแปรมากที่สุดเมื่อพิจารณาด้วยความผิดพลาดในการตรวจจับเชิงบวก เมื่อพิจารณาด้วยค่าเฉลี่ยแบบฮาร์โมนิคของค่าความแม่นยำและค่าความไว พบว่าวิธี L1 และ L0L2 มีประสิทธิภาพในการคัดกรองตัวแปรใกล้เคียงกัน แต่วิธี L0L2 จะมีประสิทธิภาพสูงกว่าเมื่อความสัมพันธ์ระหว่างตัวแปรอิสระมีค่าสูง และเมื่อพิจารณาประสิทธิภาพในการทำนายของตัวแบบด้วยพื้นที่ใต้เส้นโค้ง พบว่าวิธี L1 จะมีประสิทธิภาพสูงที่สุดในทุกกรณี


การเรียนรู้แบบรวมกลุ่มด้วยตัวแบบที่แตกต่างกันแบบขนานสำหรับข้อมูลไม่สมดุล กรณีศึกษาข้อมูลเครดิตเยอรมัน, ศศิวิมล ศรีโรจน์ Jan 2022

การเรียนรู้แบบรวมกลุ่มด้วยตัวแบบที่แตกต่างกันแบบขนานสำหรับข้อมูลไม่สมดุล กรณีศึกษาข้อมูลเครดิตเยอรมัน, ศศิวิมล ศรีโรจน์

Chulalongkorn University Theses and Dissertations (Chula ETD)

งานวิจัยนี้มีวัตถุประสงค์เพื่อสร้างตัวแบบการเรียนรู้แบบรวมกลุ่มด้วยตัวแบบที่แตกต่างกันแบบขนาน (Bagging Heterogeneous Ensemble) และหาวิธีการลดมิติข้อมูลและวิธีการสุ่มตัวอย่างซ้ำที่เหมาะสมกับข้อมูลเครดิตเยอรมันที่มีอัตราส่วนความไม่สมดุลแตกต่างกัน 3 ค่าคือ 2.3, 10 และ 14 โดยวัดประสิทธิภาพด้วยตัวชี้วัด Accuracy, The area under the curve, F1-score, Precision, Brier score และ Kolmogorov-Smirnov และทดสอบทางสถิติเพื่อแสดงว่าประสิทธิภาพของตัวแบบมีความแตกต่างกัน ที่ระดับนัยสำคัญ 0.05 ผลการศึกษาพบว่าข้อมูลเครดิตเยอรมันที่มีอัตราส่วนความไม่สมดุลต่ำ (IR = 2.3) ตัวแบบ Logistic Regression ที่ใช้เทคนิค Linear Discriminant Analysis (LDA) และ Systematic Minority Over-Sampling Technique (SM) จะมีประสิทธิภาพเฉลี่ยดีที่สุดในการจำแนกประเภท ในส่วนของอัตราส่วนความไม่สมดุลกลาง (IR = 10) และ อัตราส่วนความไม่สมดุลสูง (IR = 14) วิธีการลดมิติข้อมูลและการสุ่มตัวอย่างซ้ำที่มีประสิทธิภาพคือ Linear Discriminant Analysis (LDA), Random Under-Sampling (RUS) และ Linear Discriminant Analysis (LDA), Borderline SMOTE (BSM) ตามลำดับ โดยที่การเรียนรู้แบบรวมกลุ่มด้วยตัวแบบที่แตกต่างกันแบบขนานมีประสิทธิภาพเฉลี่ยดีที่สุด ทั้งในกรณีที่มีและไม่มีวิธีการลดมิติข้อมูลและสุ่มตัวอย่างซ้ำของอัตราส่วนความไม่สมดุลกลางและสูง


ประสิทธิภาพของวิธีการจัดการข้อมูลไม่สมดุลสำหรับการจำแนกกลุ่มภายใต้เงื่อนไขที่แตกต่างกัน, กาญธนา ลออสิริกุล Jan 2022

ประสิทธิภาพของวิธีการจัดการข้อมูลไม่สมดุลสำหรับการจำแนกกลุ่มภายใต้เงื่อนไขที่แตกต่างกัน, กาญธนา ลออสิริกุล

Chulalongkorn University Theses and Dissertations (Chula ETD)

การวิจัยนี้มีจุดประสงค์เพื่อศึกษาปฏิสัมพันธ์ของวิธีการปรับสมดุลข้อมูลกับเงื่อนไขด้านขนาดตัวอย่าง เทคนิคการจำแนกข้อมูล จำนวนตัวแปรระหว่างกลุ่มตัวแปรจัดประเภทต่อกลุ่มตัวแปรต่อเนื่อง อัตราออด และร้อยละของจำนวนข้อมูลกลุ่มหลักต่อข้อมูลกลุ่มรองที่มีต่อประสิทธิภาพของการจำแนกกลุ่ม การปรับสมดุลของข้อมูลแบ่งออกเป็น 3 วิธี ได้แก่ (1) ไม่ปรับสมดุล (2) วิธี random oversampling และ (3) วิธีผสมผสานระหว่างรูปแบบสุ่มเกินและสุ่มลด (hybrid) โดยใช้แพคเกจ ROSE ส่วนเงื่อนไขด้านขนาดตัวอย่างแบ่งออกเป็น ขนาดตัวอย่างเท่ากับ 100 300 และ 500 หน่วย ด้านเทคนิคการจำแนกข้อมูล แบ่งออกเป็น 4 วิธี ได้แก่ (1) เคเนียร์เรสเนเบอร์ (2) การถดถอยโลจิสติก (3) แรนดอมฟอร์เรส และ (4) ซัพพอร์ตเวกเตอร์แมชชีน ตัวแปรจากการจำลองแบ่งออกเป็นตัวแปรตามซึ่งจำลองด้วยการถดถอยโลจิสติก ส่วนตัวแปรอิสระในการจำลองข้อมูลครั้งนี้จะกำหนดให้ใช้ตัวแปรอิสระจำลองทั้งหมด 8 ตัว โดยกำหนดให้มีจำนวนตัวแปรระหว่างกลุ่มตัวแปรจัดประเภทต่อกลุ่มตัวแปรต่อเนื่อง 3 กรณี คือ 4:4 5:3 และ 6:2 ในขณะที่ระดับของอัตราออด จะสุ่มค่าจากช่วง [1,2) หรือ [2,3) และร้อยละของข้อมูลระหว่างข้อมูลกลุ่มหลักต่อข้อมูลกลุ่มรอง แบ่งออกเป็น 2 กรณี ได้แก่ 60:40 และ 70:30 พิจารณาเกณฑ์ประสิทธิภาพของข้อมูลด้วยตัวชี้วัดความถูกต้องในการจำแนก ความไว และความจำเพาะ การจำลองแต่ละสถานการณ์จะทำซ้ำสถานการณ์ละ 500 รอบ การวิเคราะห์ปฏิสัมพันธ์ระหว่างวิธีการปรับสมดุลข้อมูลกับเงื่อนไขต่าง ๆ ใช้การวิเคราะห์ความแปรปรวนพหุคูณหลายทาง (n-way MANOVA) ผลการวิจัยพบว่า วิธีการปรับสมดุลข้อมูลมีปฏิสัมพันธ์แบบสองทางกับเงื่อนไขด้านขนาดตัวอย่าง ร้อยละของข้อมูลระหว่างข้อมูลกลุ่มหลักต่อข้อมูลกลุ่มรอง อัตราออด และเทคนิคการจำแนกข้อมูล และพบปฏิสัมพันธ์แบบสามทางกับเงื่อนไขต่อไปนี้ (1) ขนาดตัวอย่างและจำนวนตัวแปรระหว่างกลุ่มตัวแปรจัดประเภทต่อกลุ่มตัวแปรต่อเนื่อง (2) ขนาดตัวอย่างและเทคนิคการจำแนกข้อมูล และ (3) ร้อยละของข้อมูลระหว่างข้อมูลกลุ่มหลักต่อข้อมูลกลุ่มรอง และเทคนิคการจำแนกข้อมูล ดังนั้นนักวิเคราะห์ข้อมูลควรเลือกใช้วิธีการปรับสมดุลข้อมูลโดยพิจารณาให้เหมาะสมกับสภาพของข้อมูลที่ใช้ในการวิเคราะห์


สมรรถนะดิจิทัลขององค์กรทหาร: การวิเคราะห์องค์ประกอบเชิงสำรวจและเชิงยืนยันพหุระดับ, รัมณรา สมประสงค์ Jan 2022

สมรรถนะดิจิทัลขององค์กรทหาร: การวิเคราะห์องค์ประกอบเชิงสำรวจและเชิงยืนยันพหุระดับ, รัมณรา สมประสงค์

Chulalongkorn University Theses and Dissertations (Chula ETD)

สมรรถนะดิจิทัลขององค์กรทหารในปัจจุบันมีความสำคัญต่อการปฏิบัติงานในยุคของการเปลี่ยนแปลงทางดิจิทัลที่เกิดขึ้นอย่างรวดเร็ว งานวิจัยนี้เป็นงานวิจัยเชิงบรรยาย มีวัตถุประสงค์ดังนี้ 1) เพื่อสังเคราะห์ตัวชี้วัดสมรรถนะดิจิทัลขององค์กรทหาร 2) เพื่อสำรวจองค์ประกอบพหุระดับสมรรถนะดิจิทัลขององค์กรทหาร 3) เพื่อตรวจสอบความสอดคล้องเชิงประจักษ์ขององค์ประกอบพหุระดับสมรรถนะดิจิทัลขององค์กรทหาร ตัวอย่างวิจัย เป็นบุคลากรระดับปฏิบัติการในองค์กรทหารสังกัดกระทรวงกลาโหม 50 หน่วยงาน จำนวน 860 คน สำหรับใช้ในการวิเคราะห์องค์ประกอบเชิงสำรวจพหุระดับ และจำนวน 863 คน สำหรับใช้ในการวิเคราะห์องค์ประกอบเชิงยืนยันพหุระดับ เครื่องมือที่ใช้ในการวิจัยเพื่อการวิเคราะห์องค์ประกอบพหุระดับ คือแบบวัดสมรรถนะดิจิทัลขององค์กรทหาร ประกอบไปด้วย 2 ตอน คือ ข้อมูลพื้นฐานของกำลังพลผู้ตอบแบบสอบถาม และแบบวัดสมรรถนะดิจิทัลขององค์กรทหาร จำนวน 69 ข้อคำถาม วิเคราะห์ข้อมูลด้วยโปรแกรม IBM SPSS Statistics 22 และ MPlus6 ผลการวิจัยพบว่า (1) ตัวชี้วัดสมรรถนะดิจิทัลขององค์กรทหาร ประกอบไปด้วย 16 ตัวชี้วัด ได้แก่ 1) การวางแผนการใช้งานอุปกรณ์เทคโนโลยีดิจิทัลแบบบูรณาการ 2) การสืบค้นข้อมูลทางดิจิทัล 3) การประเมินความน่าเชื่อถือของข้อมูล 4) การใช้งานเทคโนโลยีเบื้องต้น 5) การแก้ปัญหาจากการใช้เทคโนโลยีดิจิทัล 6) การใช้อินทราเน็ตขององค์กร 7) การรักษาความลับในโลกไซเบอร์ 8) การจัดการไฟล์ดิจิทัลทางการทหาร 9) การเข้าถึงไฟล์ดิจิทัลในกรณีปฏิบัติงานนอกสถานที่ 10) การจัดการฐานข้อมูลทางการทหาร 11) การใช้สื่อดิจิทัลทางไกลเพื่อการสื่อสารทางการทหาร 12) การนำเสนอข้อมูลทางทหารในรูปแบบดิจิทัล 13) การสร้างสิ่งแวดล้อมทางดิจิทัลเพื่อการทำงาน 14) การตระหนักถึงความปลอดภัยบนโลกไซเบอร์ 15) การรักษามารยาทในสังคมดิจิทัล 16) เจตคติต่อการใช้เทคโนโลยีดิจิทัลในองค์กร (2) องค์ประกอบเชิงสำรวจพหุระดับสมรรถนะดิจิทัลขององค์กรทหาร มีจำนวน 3 โมเดล คือ 1) องค์ประกอบระดับระดับบุคคล 4 องค์ประกอบ ระดับองค์กร 1 องค์ประกอบ 2) องค์ประกอบระดับบุคคล 4 องค์ประกอบ ระดับองค์กร 2 องค์ประกอบ 3) องค์ประกอบระดับบุคคล …


การเปรียบเทียบวิธีการใส่ค่าสูญหาย ในตัวแบบการถดถอยเชิงเส้นพหุที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่สัมพันธ์กัน, ศุภสันติ์ ดีมาก Jan 2022

การเปรียบเทียบวิธีการใส่ค่าสูญหาย ในตัวแบบการถดถอยเชิงเส้นพหุที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่สัมพันธ์กัน, ศุภสันติ์ ดีมาก

Chulalongkorn University Theses and Dissertations (Chula ETD)

งานวิจัยนี้มีจุดประสงค์เพื่อศึกษาและเปรียบเทียบวิธีการประมาณสูญหายในตัวแบบการถดถอยเชิงเส้นพหุคูณ ที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่มีความสัมพันธ์กัน ในการศึกษานี้มีวิธีการที่ถูกพัฒนาขึ้นคือ Expected Regression Imputation (ERI) และ Conditional Expected Regression Imputation (CERI) โดยจะเปรียบเทียบประสิทธิภาพวิธีการที่พัฒนาขึ้นมากับอีก 3 วิธีการ ได้แก่ วิธี K-Nearest Neighbor Imputation (KNN), วิธี Expectation Maximization Algorithm (EM) และ วิธี Predictive Mean Matching Imputation (PMM) ) การศึกษานี้ได้ควบคุมปัจจัยความแปรปรวนของตัวแปรอิสระ, ความสัมพันธ์ของตัวแปรอิสระ, ส่วนเบี่ยงเบนมาตรฐานค่าความคลาดเคลื่อน, ร้อยละการสูญหายและระดับ Nonignorability โดยวิธีการที่ให้ค่าเฉลี่ยของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง (Average mean square error) น้อยที่สุดจะเป็นวิธีการที่มีประสิทธิภาพสูงที่สุด ผลการวิจัยพบว่า เมื่อข้อมูลมีการกระจายตัวสูงและกลางวิธี KNN มีประสิทธิภาพสูงสุดในทุกกรณีที่ศึกษา แต่ถ้าข้อมูลกระจายตัวต่ำ วิธี KNN จะดีเมื่อกรณีตัวแปรมีความสัมพันธ์กันสูงและร้อยละการสูญหายต่ำ วิธี EM จะประสิทธิภาพสูงเมื่อร้อยละการสูญหายสูงในทุกระดับความสัมพันธ์ วิธี ERI จะประสิทธิภาพสูงเมื่อตัวแปรมีความสัมพันธ์เชิงบวกในระดับกลางลงไปในเกือบทุกกรณีที่ศึกษา วิธี CERI จะประสิทธิภาพสูงเมื่อตัวแปรมีความสัมพันธ์เชิงลบในระดับกลางลงไปและร้อยละการสูญหายต่ำ


An Analysis On Trends Of Research Topics In Civic Education Using Dynamic Topic Model, Poon Thongsai Jan 2022

An Analysis On Trends Of Research Topics In Civic Education Using Dynamic Topic Model, Poon Thongsai

Chulalongkorn University Theses and Dissertations (Chula ETD)

The aim of this thesis is to study the trend of civic and citizenship education research from 2000 to 2020 and the influence the regional background of researches has on the research discussion. Relevant data is collected from ERIC and SCOPUS database. This includes abstracts, published year, regional background of researchers, and author h-index. The keywords used are “civic education” or “citizenship education” or “civics”. There are 4917 papers extracted in total. Upon doing further preparation, 4854 articles are prepared for analysis. We apply Structural Topic model (STM) technique to the abstracts with covariates including the published year and the …


Graph Realizability And Factor Properties Based On Degree Sequence, Daniel John Jan 2022

Graph Realizability And Factor Properties Based On Degree Sequence, Daniel John

Electronic Theses and Dissertations

A graph is a structure consisting of a set of vertices and edges. Graph construction has been a focus of research for a long time, and generating graphs has proven helpful in complex networks and artificial intelligence.

A significant problem that has been a focus of research is whether a given sequence of integers is graphical. Havel and Hakimi stated necessary and sufficient conditions for a degree sequence to be graphic with different properties. In our work, we have proved the sufficiency of the requirements by generating algorithms and providing constructive proof.

Given a degree sequence, one crucial problem is …


Modeling Digital Camera Monitoring Count Data With Intermittent Zeros For Short-Term Prediction, Eben Afrifa-Yamoah, Ute Mueller Jan 2022

Modeling Digital Camera Monitoring Count Data With Intermittent Zeros For Short-Term Prediction, Eben Afrifa-Yamoah, Ute Mueller

Research outputs 2022 to 2026

Digital camera monitoring has revolutionised survey designs in many fields, as an important source of information. The extended sampling coverage offered by this monitoring scheme makes it preferable compared to other traditional methods of survey. However, data obtained from digital camera monitoring are often highly variable, and characterized by sparse periods of zero counts, interspersed with missing observations due to outages. In practice, missing data of relatively shorter duration are mostly observed and are often imputed using interpolation techniques, ignoring long-term trends leading to inherent estimation biases. In this study, we investigated time series forecasting methods that adequately handle intermittency …


Continuous And Discrete Models For Optimal Harvesting In Fisheries, Nagham Abbas Al Qubbanchee Jan 2022

Continuous And Discrete Models For Optimal Harvesting In Fisheries, Nagham Abbas Al Qubbanchee

Masters Theses

"This work focuses on the logistic growth model, where the Gordon-Schaefer model is considered in continuous time. We view the Gordon-Schaefer model as a bioeconomic equation involved in the fishing business, considering biological rates, carrying capacity, and total marginal costs and revenues. In [25], the authors illustrate the analytical solution of the Schaefer model using the integration by parts method and two theorems. The theorems have many assumptions with many different strategies. Due to the nature of the problem, the optimal control system involves many equations and functions, such as the second root of the equation. We concentrate on Theorem …


Modeling Joint Survival Probabilities Of Runs Scored And Balls Faced In Limited Overs Cricket Using Copulas, Lochana K. Palayangoda, Hasika W. Senevirathne, Ananda B. Manage Jan 2022

Modeling Joint Survival Probabilities Of Runs Scored And Balls Faced In Limited Overs Cricket Using Copulas, Lochana K. Palayangoda, Hasika W. Senevirathne, Ananda B. Manage

Mathematics & Statistics Faculty Publications

In limited overs cricket, the goal of a batsman is to score a maximum number of runs within a limited number of balls. Therefore, the number of runs scored and the number of balls faced are the two key statistics used to evaluate the performance of a batsman. In cricket, as the batsmen play as pairs, having longer partnerships is also key to building strong innings. Moreover, having a steady opening partnership is extremely important as a team aims to build such a stronger innings. In this study, we have shown a way to evaluate the performance of opening partnerships …


Review Of Copula For Bivariate Distributions Of Zero-Inflated Count Time Series Data, Dimuthu Fernando, Mohammed Alqawba, Manar Samad, Norou Diawara Jan 2022

Review Of Copula For Bivariate Distributions Of Zero-Inflated Count Time Series Data, Dimuthu Fernando, Mohammed Alqawba, Manar Samad, Norou Diawara

Mathematics & Statistics Faculty Publications

The class of bivariate integer-valued time series models, described via copula theory, is gaining popularity in the literature because of applications in health sciences, engineering, financial management and more. Each time series follows a Markov chain with the serial dependence captured using copula-based distribution functions from the Poisson and the zero-inflated Poisson margins. The copula theory is again used to capture the dependence between the two series.

However, the efficiency and adaptability of the copula are being challenged because of the discrete nature of data and also in the case of zero-inflation of count time series. Likelihood-based inference is used …


Using Deep Neural Networks To Analyze Precision Agriculture Data, Stephanie Liebl Jan 2022

Using Deep Neural Networks To Analyze Precision Agriculture Data, Stephanie Liebl

Electronic Theses and Dissertations

As the population of the Earth increases, there is a growing need for food to feed the inhabitants. Precision agriculture offers techniques and tools that can be used to help accommodate the growing population. One specific precision agriculture tool is remote sensing data, which can be used to image fields as an effort to better predict or understand the crops. In this thesis, deep neural networks are used to evaluate various spatial, spectral, and temporal resolutions of three different satellite images to determine which best predicts corn yield. The main metrics we used to evaluate the models were R-squared (R2), …


Behavioral Predictive Analytics Towards Personalization For Self-Management – A Use Case On Linking Health-Related Social Needs, Bon Sy, Michael Wassil, Helene Connelly, Alisha Hassan Jan 2022

Behavioral Predictive Analytics Towards Personalization For Self-Management – A Use Case On Linking Health-Related Social Needs, Bon Sy, Michael Wassil, Helene Connelly, Alisha Hassan

Publications and Research

The objective of this research is to investigate the feasibility of applying behavioral predictive analytics to optimize patient engagement in diabetes self-management, and to gain insights on the potential of infusing a chatbot with NLP technology for discovering health-related social needs. In the U.S., less than 25% of patients actively engage in self-health management even though self-health management has been reported to associate with improved health outcomes and reduced healthcare costs. The proposed behavioral predictive analytics relies on manifold clustering to identify subpopulations segmented by behavior readiness characteristics that exhibit non-linear properties. For each subpopulation, an individualized auto-regression model and …


Parameter Estimation And Inference Of Spatial Autoregressive Model By Stochastic Gradient Descent, Gan Luan Dec 2021

Parameter Estimation And Inference Of Spatial Autoregressive Model By Stochastic Gradient Descent, Gan Luan

Dissertations

Stochastic gradient descent (SGD) is a popular iterative method for model parameter estimation in large-scale data and online learning settings since it goes through the data in only one pass. While SGD has been well studied for independent data, its application to spatially-correlated data largely remains unexplored. This dissertation develops SGD-based parameter estimation and statistical inference algorithms for the spatial autoregressive (SAR) model, a common model for spatial lattice data.

This research contains three parts. (I) The first part concerns SGD estimation and inference for the SAR mean regression model. A new SGD algorithm based on maximum likelihood estimator (MLE) …


Dependent Censoring In Survival Analysis, Zhongcheng Lin Dec 2021

Dependent Censoring In Survival Analysis, Zhongcheng Lin

Dissertations

This dissertation mainly consists of two parts. In the first part, some properties of bivariate Archimedean Copulas formed by two time-to-event random variables are discussed under the setting of left censoring, where these two variables are subject to one left-censored independent variable respectively. Some distributional results for their joint cdf under different censoring patterns are presented. Those results are expected to be useful in both model fitting and checking procedures for Archimedean copula models with bivariate left-censored data. As an application of the theoretical results that are obtained, a moment estimator of the dependence parameter in Archimedean copula models is …


A Poisson-Akash Inrar(1) Model For Over Dispersed Count Time Series, Emmanuel W. Okereke, Sunday N. Gideon Dec 2021

A Poisson-Akash Inrar(1) Model For Over Dispersed Count Time Series, Emmanuel W. Okereke, Sunday N. Gideon

BAU Journal - Science and Technology

In this paper, a Poisson-Akash INAR(1) model was proposed in order to improve on the modelling of overdispersed stationary count time series. The estimators of the parameters of the model were derived using the Yule-Walker (YW) method and the conditional least squares (CLS) method. An expression for the conditional log-likelihood and the r-step ahead forecast were obtained for the model. Three overdispersed nonseasonal stationary count time series were modelled to illustrate the applicability of the proposed model as well as its capacity to outperform the competing INAR (1) models in modelling overdispersed stationary count time series and the result showed …


Genetic Contributors Of Incident Stroke In 10,700 African Americans With Hypertension: A Meta-Analysis From The Genetics Of Hypertension Associated Treatments And Reasons For Geographic And Racial Differences In Stroke Studies, Nicole D. Armstrong, Vinodh Srinivasasainagendra, Amit Patki, Rikki M. Tanner, Bertha A. Hidalgo, Hemant K. Tiwari, Nita A. Limdi, Ethan M. Lange, Leslie A. Lange, Donna K. Arnett, Marguerite R. Irvin Dec 2021

Genetic Contributors Of Incident Stroke In 10,700 African Americans With Hypertension: A Meta-Analysis From The Genetics Of Hypertension Associated Treatments And Reasons For Geographic And Racial Differences In Stroke Studies, Nicole D. Armstrong, Vinodh Srinivasasainagendra, Amit Patki, Rikki M. Tanner, Bertha A. Hidalgo, Hemant K. Tiwari, Nita A. Limdi, Ethan M. Lange, Leslie A. Lange, Donna K. Arnett, Marguerite R. Irvin

Epidemiology and Environmental Health Faculty Publications

Background: African Americans (AAs) suffer a higher stroke burden due to hypertension. Identifying genetic contributors to stroke among AAs with hypertension is critical to understanding the genetic basis of the disease, as well as detecting at-risk individuals.

Methods: In a population comprising over 10,700 AAs treated for hypertension from the Genetics of Hypertension Associated Treatments (GenHAT) and Reasons for Geographic and Racial Differences in Stroke (REGARDS) studies, we performed an inverse variance-weighted meta-analysis of incident stroke. Additionally, we tested the predictive accuracy of a polygenic risk score (PRS) derived from a European ancestral population in both GenHAT and REGARDS AAs …


Dysregulation Of Dna Methylation And Epigenetic Clocks In Prostate Cancer Among Puerto Rican Men, Anders Berglund, Jaime Matta, Jarline Encarnación-Medina, Carmen Ortiz-Sanchéz, Julie Dutil, Raymond Linares, Joshua Marcial, Caren Abreu-Takemura, Natasha Moreno, Ryan Putney, Ratna Chakrabarti, Hui Yi Lin, Kosj Yamoah, Carlos Diaz Osterman, Liang Wang, Jasreman Dhillon, Youngchul Kim, Seung Joon Kim, Gilberto Ruiz-Deya, Jong Y. Park Dec 2021

Dysregulation Of Dna Methylation And Epigenetic Clocks In Prostate Cancer Among Puerto Rican Men, Anders Berglund, Jaime Matta, Jarline Encarnación-Medina, Carmen Ortiz-Sanchéz, Julie Dutil, Raymond Linares, Joshua Marcial, Caren Abreu-Takemura, Natasha Moreno, Ryan Putney, Ratna Chakrabarti, Hui Yi Lin, Kosj Yamoah, Carlos Diaz Osterman, Liang Wang, Jasreman Dhillon, Youngchul Kim, Seung Joon Kim, Gilberto Ruiz-Deya, Jong Y. Park

School of Public Health Faculty Publications

In 2021, approximately 248,530 new prostate cancer (PCa) cases are estimated in the United States. Hispanic/Latinos (H/L) are the second largest racial/ethnic group in the US. The objective of this study was to assess DNA methylation patterns between aggressive and indolent PCa along with ancestry proportions in 49 H/L men from Puerto Rico (PR). Prostate tumors were classified as aggressive (n = 17) and indolent (n = 32) based on the Gleason score. Genomic DNA samples were extracted by macro-dissection. DNA methylation patterns were assessed using the Illumina EPIC DNA methylation platform. We used ADMIXTURE to estimate global ancestry proportions. …


Acute Pediatric Chagas Disease In Antioquia, Colombia: A Geographic Location Of Suspected Oral Transmission, Lídia Gual-Gonzalez, Catalina Aango-Ferreira, Laura Camila Lopera-Restrepo, Omar Cantillo-Barraza, Daniela Velásquez Marín, Natalia Restrepo Bustamante, Omar Triana-Chavez, Melissa Nolan Ph.D., Mph Dec 2021

Acute Pediatric Chagas Disease In Antioquia, Colombia: A Geographic Location Of Suspected Oral Transmission, Lídia Gual-Gonzalez, Catalina Aango-Ferreira, Laura Camila Lopera-Restrepo, Omar Cantillo-Barraza, Daniela Velásquez Marín, Natalia Restrepo Bustamante, Omar Triana-Chavez, Melissa Nolan Ph.D., Mph

Faculty Publications

Chagas disease, Trypanosoma cruzi infection, is an insidious cause of heart failure in Latin America. Early diagnosis and treatment are critical to prevent irreversible myocardial damage that progressively accumulates over decades. Several structural barriers account for the less than 1% of cases in Colombia being treated, including poor physician knowledge, especially considering that some regions are considered non-endemic. The two cases reported here represent an emerging epidemiologic scenario associated with pediatric Chagas disease. Both cases are suspected oral transmitted parasitic infection in a geographic region of Colombia (Andean region of Antioquia) where no previous oral transmission of Chagas disease had …


Approximate Likelihood Based Estimations For Joint Models With Intractable Likelihoods, Karl Stessy M. Bisselou Dec 2021

Approximate Likelihood Based Estimations For Joint Models With Intractable Likelihoods, Karl Stessy M. Bisselou

Theses & Dissertations

This dissertation focuses on the development of approximation approaches for the joint modeling (JM) of repeated measures data and time-to-event data in the presence of analytically or numerically intractable likelihoods. Current likelihood-based inferences for JMs show several limitations including (i) intractability of integrals during marginal likelihood derivations due to the complexity in computations, and (ii) the large number of nuisance parameters (unobserved) posing a problem with convergence. The h-likelihood (HL) and synthetic likelihood (SL) are two computationally efficient estimation approaches that overcome these challenges.

In the presence of extremely high censoring rates, the HL can produce bias parameter estimates. We …


Smoking, Alcohol Consumption, And Depression In Association With Incidence Of Type 2 Diabetes Among Mexican Americans In Starr County, Texas, Gabriela Rubannelsonkumar Dec 2021

Smoking, Alcohol Consumption, And Depression In Association With Incidence Of Type 2 Diabetes Among Mexican Americans In Starr County, Texas, Gabriela Rubannelsonkumar

Honors Program Theses and Research Projects

Previous studies on conditions like obesity, hypertension, and type 2 diabetes mellitus (T2DM) have explored the correlations between them and various other human conditions, including aortic stiffness, left ventricular hypertrophy and sleep apnea, as they predict possibilities of developing certain diseases in Mexican Americans. This study aims to observe the correlation between lifestyle decisions that could relate to the onset of the depression in normal, prediabetic, and diabetic individuals. These include smoking habits and alcohol consumption. Many papers have previously conducted research on these lifestyle habits as they relate to obesity, hypertension, diabetes, however, have done so in a singular …


The Efficacy Of Plant-Based Dietary Program In Patients With Diabetes: A Pilot Study, Reuben Adatorwovor, Nisha Sharma, Dakota Mccoy, Sharon Wasserstrom, Matthew Robinson, Jacquelyn Nyenhuis, Sowmya Suryanarayanan Dec 2021

The Efficacy Of Plant-Based Dietary Program In Patients With Diabetes: A Pilot Study, Reuben Adatorwovor, Nisha Sharma, Dakota Mccoy, Sharon Wasserstrom, Matthew Robinson, Jacquelyn Nyenhuis, Sowmya Suryanarayanan

Biostatistics Faculty Publications

Dietary choices play a key role in insulin sensitivity among diabetes patients. An 8-week pilot study was conducted to evaluate whether a mostly plant-based dietary program will lead to improvement in biochemical markers in adults with diabetes. The dietary program included educational presentations, weekly cooking demonstrations and small group discussions. A sample of thirty-two adults with diabetes (types 1 and 2) were recruited and seventeen (53%) completed the study. Matched-pair tests and Fishers exact tests were used to compare the changes in means and proportion of the participants’ responses. There were changes in HbA1c, lipids, CRP (mg/L), cholesterol (mg/dL), HDL …


Aspect-Based Sentiment Analysis Of Movie Reviews, Samuel Onalaja, Eric Romero, Bosang Yun Dec 2021

Aspect-Based Sentiment Analysis Of Movie Reviews, Samuel Onalaja, Eric Romero, Bosang Yun

SMU Data Science Review

This study investigates a comparison of classification models used to determine aspect based separated text sentiment and predict binary sentiments of movie reviews with genre and aspect specific driving factors. To gain a broader classification analysis, five machine and deep learning algorithms were compared: Logistic Regression (LR), Naive Bayes (NB), Support Vector Machine (SVM), and Recurrent Neural Network Long-Short-Term Memory (RNN LSTM). The various movie aspects that are utilized to separate the sentences are determined through aggregating aspect words from lexicon-base, supervised and unsupervised learning. The driving factors are randomly assigned to various movie aspects and their impact tied to …


Predicting Power Using Time Series Analysis Of Power Generation And Consumption In Texas, Joshua Eysenbach, Bodie Franklin, Andrew J. Larsen, Joel Lindsey Dec 2021

Predicting Power Using Time Series Analysis Of Power Generation And Consumption In Texas, Joshua Eysenbach, Bodie Franklin, Andrew J. Larsen, Joel Lindsey

SMU Data Science Review

Due to the recent power events in Texas, power forecasting has been brought national attention. Accurate demand forecasting is necessary to be sure that there is adequate power supply to meet consumer's needs. While Texas has a forecasting model created by the Electricity Reliability Council of Texas (ERCOT), constant efforts are required to ensure that the model stays at the state-of-the-art and is producing the most reliable forecasts possible. This research seeks to provide improved short- and medium-term forecasting models, bringing in state-of-the-art deep learning models to compare to ERCOT’s forecasts. A model that is more accurate than ERCOT’s own …


Identification And Characterization Of Forest Fire Risk Zones Leveraging Machine Learning Methods, Joshua Balson, Matt Chinchilla, Cam Lu, Jeff Washburn, Nibhrat Lohia Dec 2021

Identification And Characterization Of Forest Fire Risk Zones Leveraging Machine Learning Methods, Joshua Balson, Matt Chinchilla, Cam Lu, Jeff Washburn, Nibhrat Lohia

SMU Data Science Review

Across the United States, record numbers of wildfires are observed costing billions of dollars in property damage, polluting the environment, and putting lives at risk. The ability of emergency management professionals, city planners, and private entities such as insurance companies to determine if an area is at higher risk of a fire breaking out has never been greater. This paper proposes a novel methodology for identifying and characterizing zones with increased risks of forest fires. Methods involving machine learning techniques use the widely available and recorded data, thus making it possible to implement the tool quickly.


Basis For Changes In The Disease Burden Estimates Related To Vitamin A And Zinc Deficiencies In The 2017 And 2019 Global Burden Of Disease Studies, Sonja Y. Hess, Alexander C. Mclain, Haley Lescinsky, Kenneth H. Brown, Ashkan Afshin, Reed Atkin, Saskia Jm Osendarp Dec 2021

Basis For Changes In The Disease Burden Estimates Related To Vitamin A And Zinc Deficiencies In The 2017 And 2019 Global Burden Of Disease Studies, Sonja Y. Hess, Alexander C. Mclain, Haley Lescinsky, Kenneth H. Brown, Ashkan Afshin, Reed Atkin, Saskia Jm Osendarp

Faculty Publications

Background:

The Global Burden of Disease (GBD) Study provides estimates of death and disability from eighty-seven risk factors, including some micronutrient deficiencies. Objectives:

To review methodological changes that led to large differences in the disease burden estimates for vitamin A and Zn deficiencies between the GBD 2017 and 2019 Studies. Methods:

GBD publications were reviewed; additional information was provided by GBD researchers. Results:

Vitamin A deficiency prevalence is based on plasma retinol concentration, whereas the estimate for Zn deficiency prevalence uses dietary adequacy as a proxy. The estimated global prevalence of vitamin A deficiency for children aged 1–4 years in …


Basis For Changes In The Disease Burden Estimates Related To Vitamin A And Zinc Deficiencies In The 2017 And 2019 Global Burden Of Disease Studies, Sonja Y. Hess, Alexander C. Mclain Ph.D., Haley Lescinsky, Kenneth H. Brown, Ashkan Afshin Dec 2021

Basis For Changes In The Disease Burden Estimates Related To Vitamin A And Zinc Deficiencies In The 2017 And 2019 Global Burden Of Disease Studies, Sonja Y. Hess, Alexander C. Mclain Ph.D., Haley Lescinsky, Kenneth H. Brown, Ashkan Afshin

Faculty Publications

Background:

The Global Burden of Disease (GBD) Study provides estimates of death and disability from eighty-seven risk factors, including some micronutrient deficiencies.

Objectives:

To review methodological changes that led to large differences in the disease burden estimates for vitamin A and Zn deficiencies between the GBD 2017 and 2019 Studies.

Methods:

GBD publications were reviewed; additional information was provided by GBD researchers.

Results:

Vitamin A deficiency prevalence is based on plasma retinol concentration, whereas the estimate for Zn deficiency prevalence uses dietary adequacy as a proxy. The estimated global prevalence of vitamin A deficiency for children aged 1–4 years in …


The Development Of Authentic Virtual Reality Scenarios To Measure Individuals’ Level Of Systems Thinking Skills And Learning Abilities, Vidanelage L. Dayarathna Dec 2021

The Development Of Authentic Virtual Reality Scenarios To Measure Individuals’ Level Of Systems Thinking Skills And Learning Abilities, Vidanelage L. Dayarathna

Theses and Dissertations

This dissertation develops virtual reality modules to capture individuals’ learning abilities and systems thinking skills in dynamic environments. In the first chapter, an immersive queuing theory teaching module is developed using virtual reality technology. The objective of the study is to present systems engineering concepts in a more sophisticated environment and measure students learning abilities. Furthermore, the study explores the performance gaps between male and female students in manufacturing systems concepts. To investigate the gender biases toward the performance of developed VR module, three efficacy measures (simulation sickness questionnaire, systems usability scale, and presence questionnaire) and two effectiveness measures (NASA …