Developing predictive models for biodiesel from algae using data in published literature


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Boğaziçi Üniversitesi, FEN BİLİMLERİ ENSTİTÜSÜ, FEN BİLİMLERİ ENSTİTÜSÜ, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: İngilizce

Öğrenci: AHMET COŞGUN

Danışman: RAMAZAN YILDIRIM

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Bu tezin amacı mikroalglerden lipit üretimi üzerine yayınlanmış makaleleri inceleyerek kapsamlı bir veri tabanı geliştirmek, bu veri tabanını kullanarak bilgi çıkarımı yapmak ve daha önce yapılmamış deneylerin sonuçlarını tahmin etmek için veri madenciliği algoritmalarını kullanmaktır. Veri tabanı 106 farklı makaleden 5908 veriyle oluşturulmuş olup veritabanı raporlanan sonuç değişkenine göre iki gruba ayrılmıştır. Sonuç değişkenleri biyokütle üretimi (mg / Ld) ve lipit içeriği (w / w) olarak alınmıştır. Giriş değişkenlerinin sonuç değişkenlerine etkisi, aynı giriş değişkeninin etkisiyle ilgilenen makalelerin karşılaştırılması yoluyla ön analiz olarak incelenmiştir. Bilgi çıkarımı ve tahmin-sınıflandırma amaçları için, MATLAB ve R'nin kütüphaneleri ve fonksiyonları kullanılarak her iki veri setine ilişkilendirme kural madenciliği, karar ağacı ve yapay sinir ağı algoritmaları uygulanmıştır. İlişkilendirme kural madenciliği ile Chlorella, Chlorococcum ve Nannochloropsis mikroalg türlerinin yüksek miktarda biyokütle üretimi ve lipit içeriğine sahip olabileceği bulunmuştur. Sınıflandırma amaçlı modeller doğruluğa, tahmin amaçlı modeller, standart hata, karesel ortalama hata ve determinasyon katsayılarına göre karşılaştırılmış ve değerlendirilmiştir. Veri tabanı rastgele olarak eğitim ve test setine bölünmüş ve eğitim seti model kurmak için kullanılırken test seti karesel ortalama hata ve determinasyon katsayısını bulmak için kullanılmıştır. Sınıflandırma için karar ağacı algoritması kullanılarak oluşturulan optimum modeller, biyokütle üretimi için % 77.8, lipit içeriği için % 62.2 doğruluk ile sonuçlanmıştır. Öngörülü modelleme için yapay sinir ağı algoritması kullanılmıştır. Standart hata, karesel ortalama hata ve determinasyon katsayıları, biyokütle üretimi ve lipit içeriği modelleri için 50, 80 ve 0.7 ve 7, 11, 0.3 şeklinde bulunmuştur. Lipit içeriği için yapılandırılmış modellerin tahmin gücü, biyokütle üretimi kadar güçlü çıkmamıştır. Girdi önem analizi, biyokütle üretimi için besinsel değişkenlerin en belirleyici değişkenler olduğunu, mikroalg tipinin ise lipit içeriği için en belirleyici değişken olduğunu göstermiştir.