|
" Multi-Class Categorization of User-Generated Content in a Domain Specific Medium : Inferring Product Specifications from e-Commerce Marketplaces "
Uçar, Kemal Toprak
Tümer, M. Borahan
Document Type
|
:
|
Latin Dissertation
|
Language of Document
|
:
|
English
|
Record Number
|
:
|
1056821
|
Doc. No
|
:
|
TL55938
|
Main Entry
|
:
|
Uçar, Kemal Toprak
|
Title & Author
|
:
|
Multi-Class Categorization of User-Generated Content in a Domain Specific Medium : Inferring Product Specifications from e-Commerce Marketplaces\ Uçar, Kemal ToprakTümer, M. Borahan
|
College
|
:
|
Marmara Universitesi (Turkey)
|
Date
|
:
|
2019
|
Degree
|
:
|
Master's
|
student score
|
:
|
2019
|
Note
|
:
|
67 p.
|
Abstract
|
:
|
Pazaryeri, ürün ve envanter bilgilerinin çeşitli üçüncü taraflarca sağlandığı, katalog hizmetinin verildiği ve ödemelerin piyasa operatörü tarafından yönetildiği bir e-ticaret aracıdır. Pazaryerlerinin kullanımının artmasının bir sonucu olarak, e-ticaret olanağına şimdi herkes tarafından erişilebilmektedir. Bununla birlikte hem satıcı sayısı hem de ürün sayısı katlanarak artmıştır ve artmaktadır. Bu büyüme, “Ürün açıklaması, ürünün gerçek özelliklerini yansıtıyor mu?”, “Satıcı ürüne gerçekten sahip mi?”, “Bu ürün çevrimiçi satın almak için yasal mı?”, “Bu ürün doğru tür altında mı listeleniyor?” gibi bazı sorular sormamıza neden oluyor. Çoğu ülkede e-ticaret etkin olarak kullanıldığından, bu tür sorunlar yasal yaptırımlara veya satıcının etkinliklerinin tümüyle yasaklanmasına neden olabilir. Bu çalışmada, e-ticaret kullanıcısı tarafından oluşturulan içeriği kullanarak ürünün türünü belirleyen bir yöntem sunuyoruz, böylece belirli ürünlerin proaktif olarak kaldırılmasını otomatikleştiriyoruz. Yöntemimiz veri toplama, veri temizliği ve tür belirleme olarak üç ana işlemden oluşan bir sistem önermektedir. Bu çalışmada; yapılandırılmamış metni, yapay öğrenmeye hazır veri kümesi hazırlama aşamasında sözcüklerin vektörel temsillerine dönüştürüyoruz. Yapay zekâ modellerini yarım milyondan fazla ürün bilgisi içeren geniş bir metin yelpazesiyle eğitiyoruz. Son olarak, sonuçlarımızı farklı sınıflandırma algoritmaları ve vektör temsil yöntemleriyle karşılaştırdık. Sonuç olarak, ürün kategorilerinin kullanıcı tarafından oluşturulan, yazım hataları, özel noktalama işaretleri ve kısaltmalar içerebilen, denetlenmeyen bir e-ticaret sitesinden elde edilen bir metinden 0.86 F-score gibi performansla çıkartılabileceğini gösterdik.
|
Descriptor
|
:
|
Artificial intelligence
|
|
:
|
Computer engineering
|
Added Entry
|
:
|
Tümer, M. Borahan
|
Added Entry
|
:
|
Marmara Universitesi (Turkey)
|
| |