Machine learning analysis of data collected from published literature on photocatalytic reforming of glycerol
Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Boğaziçi Üniversitesi, FEN BİLİMLERİ ENSTİTÜSÜ, FEN BİLİMLERİ ENSTİTÜSÜ, Türkiye
Tezin Onay Tarihi: 2023
Tezin Dili: İngilizce
Öğrenci: RÜVEYDA KARAKOYUN
Danışman: RAMAZAN YILDIRIM
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:Bu tezin amacı, gliserolün fotokatalitik reformlanması hakkında yayınlanmış literatürden toplanan verideki bilgiyi açığa çıkarmaktır. 93 makaleden 791 veri noktası toplanmıştır. Bu veriler makine öğrenmesi metotları için temizlenmiş, düzenlenmiş ve hazırlanmıştır. Rastgele orman ve YSA (Yapay Sinir Ağı) makine öğrenmesi teknikleri olarak kullanılmıştır. Bu teknikleri kullanarak, bant aralığı ve hidrojen üretim hızları için modeller oluşturulmuştur. Aşırı öğrenmeyi önlemek için tüm modellere çapraz doğrulama uygulanmıştır. Hidrojen üretim hızı modeli için, bant aralığında eksik olan değerler, bant aralığının YSA modelinde tahmin edilen değerler ile doldurulmuştur. Rastgele ormanda, özelliklerin önemi belirlenmiş ve sonuca en yüksek etkisi olan değişkenler bulunmuştur. Bant aralığı için en önemli olan değişkenler kokatalizörün ağırlık yüzdesi, yarıiletkenin yüzdesi ve kalsinasyon sıcaklığıdır. Hidrojen üretim hızı için en önemli değişkenler fotokatalizör yüklemesi, bant aralığı, gliserol konsantrasyonu, kokatalizörün ağırlık yüzdesi ve pH'dır. Rastgele ormanda, ağaç sayısı ve düğümün içerdiği örnek sayısı için k-katmanlı çapraz doğrulamada test/eğitim seti ayırma oranı ve k değerleri değiştirilerek en iyi model belirlenmiştir. Bant aralığı için 0.25 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 41 ağaç ve 1 örnek, 0.234 RMSE ve 0.73 R-kare ile en iyi sonucu vermiştir. Hidrojen üretim hızı modeli için ise 0.25 test/eğitim seti ayırma oranı, 5-katmanlı çapraz doğrulama, 81 ağaç ve 2 örnek, 1.09 x 104 RMSE ve 0.71 R-kare değeri ile en iyi model olmuştur. YSA için, nöron sayısı, aktivasyon fonksiyonu, test/eğitim seti ayırma yüzdesi ve k değerleri değiştirilerek en iyi model belirlendi. Bant aralığı için 0.3 test/eğitim seti ayırma oranı, 4-katmanlı çapraz doğrulama, 52 nöron ve ReLU aktivasyon fonksiyonu, 0.282 RMSE ve 0.70 R kare değeri ile en iyi modeli vermiştir. Hidrojen üretim hızı için ise 0.25 test/eğitim seti ayırma oranı, 7-katmanlı çapraz doğrulama, 3 nöron ve ReLU aktivasyon fonksiyonu RMSE 1.47 x 104 ve R-kare değeri 0.60 ile en iyi modeli vermiştir.