Aradığımı buldum. Herkesin bildiği fakat söylemediği bir mevzu imiş :) Örneğin, şu ana kadar kullandığım tüm datasetler benchmark dataset imiş benim.
Ufak bir açıklama da şöyle belki lazım olan olur:
Benchmark datasetler, herhangi bir işareti işleyen kimsenin, çalışması sonucunda ortaya çıkardığı verilerin doğruluğunu test etmesine, aynı işareti işleyen diğer kimselerle ortak çalışma yürütebilmesine yarayan veri topluluklarıdır.
Örnek olarak sunacağım, MIT-BIH arrythmia database, bir benchmark dataset örneğidir. Benchmark datasetler, genellikle konu hakkında çalışan (muhtemelen datasetin oluşturulmasında katkısı bulunan) akademisyenler tarafından yapılan bir makale ile bilim dünyasına tanıtılır, böylece standardize olmaya başlar. Benim örnek olarak verdiğim MIT-BIH arrhythmia database, Mark RG, Schluter PS, Moody GB, Devlin, PH, Chernoff, D. Kişileri tarafından yayınlanan, “An annotated ECG database for evaluating arrhythmia detectors” isimli yayınla standart olarak kabul edilmeye başlanmıştır. Bu yayın, önce analog formatta hizmete sunulurken, 1990 yılında CD-ROM ortamında da sunulmaya başlanmıştır.
MIT-BIH database, 1982 yılında aktif olarak kullanılmaya başlandığından beri, yalnızca IEEE tarafından yapılan 439 konferans bildirisi ve 53 makalede veri olarak kullanılmış veya karşılaştırmaya tabi tutulmuştur.
0