Knowledge extraction from published papers in literature for the catalytic methanol production from synthesis gas using data mining tools
Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Boğaziçi Üniversitesi, FEN BİLİMLERİ ENSTİTÜSÜ, FEN BİLİMLERİ ENSTİTÜSÜ, Türkiye
Tezin Onay Tarihi: 2016
Tezin Dili: İngilizce
Öğrenci: DENNIS MOSKOV
Danışman: RAMAZAN YILDIRIM
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:Bu çalışmada, literatürde yayınlanmış makalelerden metanol sentezi konusunda bilgi çıkarımı yapmak ve gelecek çalışmalarda kullanılabilecek modeller geliştirmek için bir veri tabanı oluşturulmuştur. Bu veri tabanı, katalizör bileşimi, katalizör hazırlanması ve reaksiyon koşulları gibi 28 girdi değişkeninin, çıktı değişkenleri olarak COX dönüşümü, metanol seçimliliği ve metanol verimine etkisini gösteren 337 veri noktası içermektedir. COX dönüşümü, metanol seçimliliği ve metanol verimi için birbirinden bağımsız olarak R 3.2.3 ortamında çoklu doğrusal regresyon (ÇDR), karar ağacı ve rastgele orman (RO) yöntemleri uygulanmıştır. ÇDR ve regresyon ağaçları yorumlanabilir sonuçlar üretmede başarısız olmuştur. Sınıflandırma ağaçları ise çıktı değişkenleri kategorik hale getirilerek uygulanmış, öğrenmede yanlış sınıflandırma hataları dönüşüm, seçimlilik ve verim için sırasıyla %22, %32 ve %25 olmuştur. Test aşamasında bu oranlar çok yüksek olduğundan (sırasıyla %73, %83 ve %77) sınıflandırma ağaçlarının bir takım ampirik gözlemler elde etmek için kullanılabileceğine, ancak bunların daha önce görülmemiş deneyleri tahmin etme yeteneğine sahip olmadığına karar verilmiştir. RO tekniği ile üretilen model ise 0,95 gibi yüksek R_(adj.)^2 değerleri ile istatistiksel açıdan başarılı bulunmuş ve değişkenlerin göreceli önemleri ile ilgili bilgiler elde etmek üzere kullanılmıştır. COX dönüşümü için indirgeme süresi ve katalizör hazırlama yönteminin en önemli değişkenler olduğu görülürken, metanol seçimliliği için temel değişkenlerin reaksiyon sıcaklığı ve CO/CO2 oranı olduğu gözlenmiş, verim için ise, indirgeme sıcaklığı ve besleme bileşimindeki CO miktarının etkili oldukları saptanmıştır. Öte yandan, tahmin için ortalama karekök hata değerleri 0,12 ve 0,34 gibi düşük bir aralıkta olmasına rağmen; RO, daha önce görülmemiş deneyleri başarılı bir şekilde tahmin edememekte ve neredeyse rastgele sonuçlar vermektedir. Sonuç olarak veri madenciliği araçlarının, analiz ve kural çıkarımı gibi açıklayıcı görevlerde başarıyla kullanılmasına rağmen; dönüşümü, seçimliliği ve veriminin tahmininde başarısız olduğuna karar verilmiştir.