Список наборів даних для досліджень з машинного навчання: відмінності між версіями
[очікує на перевірку] | [очікує на перевірку] |
посилання |
ссылка |
||
Рядок 633: | Рядок 633: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|1992 |
|1992 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/927619906 |
|||
|title=Knowledge engineering : building cognitive assistants for evidence-based reasoning |
|||
|last=author. |
|||
|first=Tecuci, Gheorghe, |
|||
|isbn=978-1-107-12256-7 |
|||
|oclc=927619906 |
|||
}}</ref> |
|||
|H. Guvenir et al. |
|H. Guvenir et al. |
||
|- |
|- |
||
Рядок 643: | Рядок 650: | ||
|OCR, класифікація |
|OCR, класифікація |
||
|1991 |
|1991 |
||
|<ref>{{Cite news|title=Letter recognition using Holland-style adaptive classifiers|url=http://dx.doi.org/10.1007/bf00114162|work=Machine Learning|date=1991-03|accessdate=2022-05-20|issn=0885-6125|doi=10.1007/bf00114162|pages=161–182|volume=6|issue=2|first=Peter W.|last=Frey|first2=David J.|last2=Slate}}</ref><ref>{{Cite news|title=Improved learning of Riemannian metrics for exploratory analysis|url=https://linkinghub.elsevier.com/retrieve/pii/S0893608004001558|work=Neural Networks|date=2004-10|accessdate=2022-05-20|doi=10.1016/j.neunet.2004.06.008|pages=1087–1100|volume=17|issue=8-9|language=en|first=Jaakko|last=Peltonen|first2=Arto|last2=Klami|first3=Samuel|last3=Kaski}}</ref> |
|||
| |
|||
|D. Slate et al. |
|D. Slate et al. |
||
|- |
|- |
||
Рядок 654: | Рядок 661: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2009 |
|2009 |
||
|<ref>{{Cite news|title=Online and offline handwritten Chinese character recognition: Benchmarking on new databases|url=https://linkinghub.elsevier.com/retrieve/pii/S0031320312002919|work=Pattern Recognition|date=2013-01|accessdate=2022-05-20|doi=10.1016/j.patcog.2012.06.021|pages=155–162|volume=46|issue=1|language=en|first=Cheng-Lin|last=Liu|first2=Fei|last2=Yin|first3=Da-Han|last3=Wang|first4=Qiu-Feng|last4=Wang}}</ref> |
|||
| |
|||
|CASIA |
|CASIA |
||
|- |
|- |
||
Рядок 665: | Рядок 672: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2009 |
|2009 |
||
|<ref>{{Cite news|title=CASIA-OLHWDB1: A Database of Online Handwritten Chinese Characters|url=https://ieeexplore.ieee.org/document/5277629/|work=2009 10th International Conference on Document Analysis and Recognition|date=2009-07|accessdate=2022-05-20|doi=10.1109/ICDAR.2009.163|pages=1206–1210|first=Da-Han|last=Wang|first2=Cheng-Lin|last2=Liu|first3=Jin-Lun|last3=Yu|first4=Xiang-Dong|last4=Zhou}}</ref><ref>{{Cite news|title=Online and offline handwritten Chinese character recognition: Benchmarking on new databases|url=https://linkinghub.elsevier.com/retrieve/pii/S0031320312002919|work=Pattern Recognition|date=2013-01|accessdate=2022-05-20|doi=10.1016/j.patcog.2012.06.021|pages=155–162|volume=46|issue=1|language=en|first=Cheng-Lin|last=Liu|first2=Fei|last2=Yin|first3=Da-Han|last3=Wang|first4=Qiu-Feng|last4=Wang}}</ref> |
|||
| |
|||
|CASIA |
|CASIA |
||
|- |
|- |
||
Рядок 675: | Рядок 682: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2008 |
|2008 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/11840930_66 |
|||
|title=Extracting Motion Primitives from Natural Handwriting Data |
|||
|last=Williams |
|||
|first=Ben H. |
|||
|last2=Toussaint |
|||
|first2=Marc |
|||
|last3=Storkey |
|||
|first3=Amos J. |
|||
|date=2006 |
|||
|series=Artificial Neural Networks – ICANN 2006 |
|||
|publisher=Springer Berlin Heidelberg |
|||
|location=Berlin, Heidelberg |
|||
|pages=634–643 |
|||
|isbn=978-3-540-38871-5 |
|||
}}</ref><ref>{{Cite book |
|||
|url=http://worldcat.org/oclc/40434775 |
|||
|title=1998 IEEE/ACM International Conference on Computer-Aided Design : digest of technical papers : November 8-12, 1998, San Jose, California |
|||
|last=Calif.) |
|||
|first=IEEE/ACM International Conference on Computer-Aided Design (1998 : San Jose, |
|||
|date=1998 |
|||
|publisher=IEEE Computer Society Press |
|||
|isbn=1-58113-008-2 |
|||
|oclc=40434775 |
|||
}}</ref> |
|||
|B. Williams |
|B. Williams |
||
|- |
|- |
||
|Chars74K Dataset |
|Chars74K Dataset |
||
|Розпізнавання символів у природних зображеннях символів, які використовуються як англійською, так і |
|Розпізнавання символів у природних зображеннях символів, які використовуються як англійською, так і каннадською |
||
|Тривимірна матриця траєкторій швидкості кінчика пера для кожного зразка |
|Тривимірна матриця траєкторій швидкості кінчика пера для кожного зразка |
||
|74,107 |
|74,107 |
||
Рядок 685: | Рядок 716: | ||
|Розпізнавання символів, розпізнавання рукописного тексту, OCR, класифікація |
|Розпізнавання символів, розпізнавання рукописного тексту, OCR, класифікація |
||
|2009 |
|2009 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/555471615 |
|||
|title=Recent issues in pattern analysis and recognition |
|||
|last=V. |
|||
|first=Cantoni, |
|||
|date=1989 |
|||
|publisher=Springer-Verlag |
|||
|oclc=555471615 |
|||
}}</ref> |
|||
|T. de Campos |
|T. de Campos |
||
|- |
|- |
||
Рядок 695: | Рядок 734: | ||
|розпізнавання символів, класифікація, розпізнавання почерку |
|розпізнавання символів, класифікація, розпізнавання почерку |
||
|2016 |
|2016 |
||
|EMNIST dataset |
|EMNIST dataset<ref>{{Cite book |
||
|url=http://worldcat.org/oclc/1106257270 |
|||
Documentation |
|||
|title=EMNIST: an extension of MNIST to handwritten letters |
|||
|last=André |
|||
|first=Cohen, Gregory Afshar, Saeed Tapson, Jonathan van Schaik, |
|||
|date=2017-02-17 |
|||
|oclc=1106257270 |
|||
}}</ref> |
|||
Documentation<ref>{{Cite news|title=EMNIST: an extension of MNIST to handwritten letters|url=http://arxiv.org/abs/1702.05373|work=arXiv:1702.05373 [cs]|date=2017-02-17|accessdate=2022-05-20|first=Gregory|last=Cohen|first2=Saeed|last2=Afshar|first3=Jonathan|last3=Tapson|first4=André|last4=van Schaik}}</ref> |
|||
|Gregory Cohen, et al |
|Gregory Cohen, et al |
||
|- |
|- |
||
Рядок 706: | Рядок 752: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2009 |
|2009 |
||
|<ref>{{Cite web|title=Figure 4: Samples of handwritten isolated Arabic characters.|url=http://dx.doi.org/10.7717/peerjcs.955/fig-4|website=dx.doi.org|accessdate=2022-05-20}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1201/b12989-9 |
|||
|title=One-Shot Learning Considerations |
|||
|date=2012-11-20 |
|||
|series=Internet-Scale Pattern Recognition |
|||
|publisher=Chapman and Hall/CRC |
|||
|pages=53–66 |
|||
}}</ref> |
|||
|F. Prat et al. |
|F. Prat et al. |
||
|- |
|- |
||
Рядок 717: | Рядок 770: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2003 |
|2003 |
||
|<ref>{{Cite web|title=Figure 10: Combination the result of feature selection and WGCNA.|url=http://dx.doi.org/10.7717/peerj.8456/fig-10|website=dx.doi.org|accessdate=2022-05-20}}</ref> |
|||
| |
|||
|Yann LeCun et al. |
|Yann LeCun et al. |
||
|- |
|- |
||
Рядок 728: | Рядок 781: | ||
|Класифікація, одноразове навчання |
|Класифікація, одноразове навчання |
||
|2015 |
|2015 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1113542889 |
|||
|title=Artificial General Intelligence : 8th International Conference, AGI 2015, AGI 2015, Berlin, Germany, July 22-25, 2015, Proceedings |
|||
|last=editor |
|||
|first=Bieger, Jordi., editor Goertzel, Ben., editor Potapov, Alexey., |
|||
|isbn=3-319-21365-2 |
|||
|oclc=1113542889 |
|||
}}</ref><ref>{{Cite book |
|||
|url=http://worldcat.org/oclc/1268260200 |
|||
|title=Artificial neural networks and machine learning -- ICANN 2021 : 30th International Conference on Artificial Neural Networks, Bratislava, Slovakia, September 14-17, 2021, Proceedings. |
|||
|last=Online) |
|||
|first=International Conference on Artificial Neural Networks (European Neural Network Society) (30th : 2021 : |
|||
|isbn=978-3-030-86340-1 |
|||
|oclc=1268260200 |
|||
}}</ref> |
|||
|American Association for the Advancement of Science |
|American Association for the Advancement of Science |
||
|- |
|- |
||
Рядок 739: | Рядок 806: | ||
|Класифікація |
|Класифікація |
||
|1998 |
|1998 |
||
|<ref>{{Cite news|title=Gradient-based learning applied to document recognition|url=http://ieeexplore.ieee.org/document/726791/|work=Proceedings of the IEEE|date=Nov./1998|accessdate=2022-05-20|doi=10.1109/5.726791|pages=2278–2324|volume=86|issue=11|first=Y.|last=Lecun|first2=L.|last2=Bottou|first3=Y.|last3=Bengio|first4=P.|last4=Haffner}}</ref><ref>{{Cite news|title=Improved method of handwritten digit recognition tested on MNIST database|url=https://linkinghub.elsevier.com/retrieve/pii/S0262885604000721|work=Image and Vision Computing|date=2004-10|accessdate=2022-05-20|doi=10.1016/j.imavis.2004.03.008|pages=971–981|volume=22|issue=12|language=en|first=Ernst|last=Kussul|first2=Tatiana|last2=Baidyk}}</ref> |
|||
| |
|||
|National Institute of Standards and Technology |
|National Institute of Standards and Technology |
||
|- |
|- |
||
Рядок 750: | Рядок 817: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|1998 |
|1998 |
||
|<ref>{{Cite news|title=Methods of combining multiple classifiers and their applications to handwriting recognition|url=http://ieeexplore.ieee.org/document/155943/|work=IEEE Transactions on Systems, Man, and Cybernetics|date=May-June/1992|accessdate=2022-05-20|doi=10.1109/21.155943|pages=418–435|volume=22|issue=3|first=L.|last=Xu|first2=A.|last2=Krzyzak|first3=C.Y.|last3=Suen}}</ref> |
|||
| |
|||
|E. Alpaydin et al. |
|E. Alpaydin et al. |
||
|- |
|- |
||
Рядок 761: | Рядок 828: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|1998 |
|1998 |
||
|<ref>{{Cite news|title=Combining multiple representations and classifiers for pen-based handwritten digit recognition|url=http://dx.doi.org/10.1109/icdar.1997.620583|publisher=IEEE Comput. Soc|work=Proceedings of the Fourth International Conference on Document Analysis and Recognition|accessdate=2022-05-20|doi=10.1109/icdar.1997.620583|first=F.|last=Alimoglu|first2=E.|last2=Alpaydin}}</ref><ref>{{Cite news|title=Linear dimensionality reduction using relevance weighted LDA|url=https://linkinghub.elsevier.com/retrieve/pii/S0031320304003619|work=Pattern Recognition|date=2005-04|accessdate=2022-05-20|doi=10.1016/j.patcog.2004.09.005|pages=485–493|volume=38|issue=4|language=en|first=E.K.|last=Tang|first2=P.N.|last2=Suganthan|first3=X.|last3=Yao|first4=A.K.|last4=Qin}}</ref> |
|||
| |
|||
|E. Alpaydin et al. |
|E. Alpaydin et al. |
||
|- |
|- |
||
Рядок 772: | Рядок 839: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2008 |
|2008 |
||
|<ref>{{Cite news|title=Methods of combining multiple classifiers and their applications to handwriting recognition|url=http://ieeexplore.ieee.org/document/155943/|work=IEEE Transactions on Systems, Man, and Cybernetics|date=May-June/1992|accessdate=2022-05-20|doi=10.1109/21.155943|pages=418–435|volume=22|issue=3|first=L.|last=Xu|first2=A.|last2=Krzyzak|first3=C.Y.|last3=Suen}}</ref> |
|||
| |
|||
|T. Srl |
|T. Srl |
||
|- |
|- |
||
Рядок 783: | Рядок 850: | ||
|Класифікація |
|Класифікація |
||
|2017 |
|2017 |
||
|<ref>{{Cite news|title=[Endocrinologic peculiarities of the course of pregnancy and labor in primaparous women of the older age groups]|url=https://pubmed.ncbi.nlm.nih.gov/1701|work=Pediatriia Akusherstvo I Ginekologiia|date=1975|accessdate=2022-05-20|issn=0031-4048|pmid=1701|pages=41–44|issue=5|first=K. I.|last=Drahan}}</ref> |
|||
| |
|||
|Martin Thoma |
|Martin Thoma |
||
|- |
|- |
||
Рядок 799: | Рядок 866: | ||
|Розпізнавання рукописного тексту, класифікація |
|Розпізнавання рукописного тексту, класифікація |
||
|2017 |
|2017 |
||
|<ref>{{Cite news|title=The jumping mechanism of Xenopsylla cheopis. III. Execution of the jump and activity|url=https://pubmed.ncbi.nlm.nih.gov/1806|work=Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences|date=1975-10-30|accessdate=2022-05-20|issn=0962-8436|pmid=1806|doi=10.1098/rstb.1975.0064|pages=499–515|volume=271|issue=914|first=M.|last=Rothschild|first2=J.|last2=Schlein|first3=K.|last3=Parker|first4=C.|last4=Neville|first5=S.|last5=Sternberg}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://link.springer.com/10.1007/978-3-030-34058-2_1 |
|||
|title=PCGAN-CHAR: Progressively Trained Classifier Generative Adversarial Networks for Classification of Noisy Handwritten Bangla Characters |
|||
|last=Liu |
|||
|first=Qun |
|||
|last2=Collier |
|||
|first2=Edward |
|||
|last3=Mukhopadhyay |
|||
|first3=Supratik |
|||
|date=2019 |
|||
|editor-last=Jatowt |
|||
|editor-first=Adam |
|||
|editor2-last=Maeda |
|||
|editor2-first=Akira |
|||
|editor3-last=Syn |
|||
|editor3-first=Sue Yeon |
|||
|series=Digital Libraries at the Crossroads of Digital Information for the Future |
|||
|publisher=Springer International Publishing |
|||
|volume=11853 |
|||
|location=Cham |
|||
|pages=3–15 |
|||
|language=en |
|||
|doi=10.1007/978-3-030-34058-2_1 |
|||
|isbn=978-3-030-34057-5 |
|||
}}</ref> |
|||
|M. Karki et al. |
|M. Karki et al. |
||
|} |
|} |
||
Рядок 822: | Рядок 913: | ||
|Повітряна класифікація, виявлення об'єктів, сегментація екземплярів |
|Повітряна класифікація, виявлення об'єктів, сегментація екземплярів |
||
|2019 |
|2019 |
||
|<ref>{{Cite web|title=iSAID|url=https://captain-whu.github.io/iSAID/index.html|website=captain-whu.github.io|accessdate=2022-05-20}}</ref> |
|||
| |
|||
|Syed Waqas Zamir, |
|Syed Waqas Zamir, |
||
Aditya Arora, |
Aditya Arora, |
||
Рядок 843: | Рядок 934: | ||
|Повітряна класифікація, виявлення об'єктів |
|Повітряна класифікація, виявлення об'єктів |
||
|2013 |
|2013 |
||
|<ref>{{Cite news|title=Integrating pedestrian simulation, tracking and event detection for crowd analysis|url=http://dx.doi.org/10.1109/iccvw.2011.6130237|publisher=IEEE|work=2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops)|date=2011-11|accessdate=2022-05-20|doi=10.1109/iccvw.2011.6130237|first=Matthias|last=Butenuth|first2=Florian|last2=Burkert|first3=Florian|last3=Schmidt|first4=Stefan|last4=Hinz|first5=Dirk|last5=Hartmann|first6=Angelika|last6=Kneidl|first7=Andre|last7=Borrmann|first8=Beril|last8=Sirmacek}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1113880051 |
|||
|title=Computational intelligence in pattern recognition : proceedings of CIPR 2019 |
|||
|last=India) |
|||
|first=CIPR (Conference) (1st : 2019 : Sibpur, |
|||
|isbn=978-981-13-9042-5 |
|||
|oclc=1113880051 |
|||
}}</ref> |
|||
|J. Yuan et al. |
|J. Yuan et al. |
||
|- |
|- |
||
Рядок 853: | Рядок 951: | ||
|Відстеження людей, повітряне спостереження |
|Відстеження людей, повітряне спостереження |
||
|2012 |
|2012 |
||
|<ref>{{Cite news|title=Integrating pedestrian simulation, tracking and event detection for crowd analysis|url=http://dx.doi.org/10.1109/iccvw.2011.6130237|publisher=IEEE|work=2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops)|date=2011-11|accessdate=2022-05-20|doi=10.1109/iccvw.2011.6130237|first=Matthias|last=Butenuth|first2=Florian|last2=Burkert|first3=Florian|last3=Schmidt|first4=Stefan|last4=Hinz|first5=Dirk|last5=Hartmann|first6=Angelika|last6=Kneidl|first7=Andre|last7=Borrmann|first8=Beril|last8=Sirmacek}}</ref><ref>{{Cite news|title=Low level crowd analysis using frame-wise normalized feature for people counting|url=http://dx.doi.org/10.1109/wifs.2012.6412657|publisher=IEEE|work=2012 IEEE International Workshop on Information Forensics and Security (WIFS)|date=2012-12|accessdate=2022-05-20|doi=10.1109/wifs.2012.6412657|first=Hajer|last=Fradi|first2=Jean-Luc|last2=Dugelay}}</ref> |
|||
| |
|||
|M. Butenuth et al. |
|M. Butenuth et al. |
||
|- |
|- |
||
Рядок 863: | Рядок 961: | ||
|Класифікація, виявлення повітряних об'єктів |
|Класифікація, виявлення повітряних об'єктів |
||
|2014 |
|2014 |
||
|<ref>{{Cite news|title=A hybrid pansharpening approach and multiscale object-based image analysis for mapping diseased pine and oak trees|url=http://dx.doi.org/10.1080/01431161.2013.810825|work=International Journal of Remote Sensing|date=2013-06-27|accessdate=2022-05-20|issn=0143-1161|doi=10.1080/01431161.2013.810825|pages=6969–6982|volume=34|issue=20|first=Brian Alan|last=Johnson|first2=Ryutaro|last2=Tateishi|first3=Nguyen Thanh|last3=Hoan}}</ref><ref>{{Cite news|title=A new classification model for a class imbalanced data set using genetic programming and support vector machines: case study for wilt disease classification|url=http://www.tandfonline.com/doi/full/10.1080/2150704X.2015.1062159|work=Remote Sensing Letters|date=2015-07-03|accessdate=2022-05-20|issn=2150-704X|doi=10.1080/2150704X.2015.1062159|pages=568–577|volume=6|issue=7|language=en|first=Muhammad Syafiq|last=Mohd Pozi|first2=Md Nasir|last2=Sulaiman|first3=Norwati|last3=Mustapha|first4=Thinagaran|last4=Perumal}}</ref> |
|||
| |
|||
|B. Johnson |
|B. Johnson |
||
|- |
|- |
||
Рядок 873: | Рядок 971: | ||
|Класифікація, виявлення повітряних об'єктів |
|Класифікація, виявлення повітряних об'єктів |
||
|2018 |
|2018 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/971084912 |
|||
|title=Eighth International Conference on Digital Image Processing (ICDIP 2016) : 20-23 May 2016, Chengdu, China |
|||
|last=China) |
|||
|first=International Conference on Digital Image Processing (8th : 2016 : Chengdu, |
|||
|isbn=1-5106-0504-5 |
|||
|oclc=971084912 |
|||
}}</ref><ref>{{Cite web|title=MASATI dataset - MAritime SATellite Imagery dataset|url=https://www.iuii.ua.es/datasets/masati/|website=www.iuii.ua.es|accessdate=2022-05-20|language=en|first=Antonio-Javier|last=Gallego}}</ref> |
|||
|A.-J. Gallego et al. |
|A.-J. Gallego et al. |
||
|- |
|- |
||
Рядок 883: | Рядок 988: | ||
|Класифікація |
|Класифікація |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=Automatic Ship Classification from Optical Aerial Images with Convolutional Neural Networks|url=http://dx.doi.org/10.3390/rs10040511|work=Remote Sensing|date=2018-03-24|accessdate=2022-05-20|issn=2072-4292|doi=10.3390/rs10040511|pages=511|volume=10|issue=4|first=Antonio-Javier|last=Gallego|first2=Antonio|last2=Pertusa|first3=Pablo|last3=Gil}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/978-81-322-2757-1_23 |
|||
|title=Forest Type Classification: A Hybrid NN-GA Model Based Approach |
|||
|last=Chatterjee |
|||
|first=Sankhadeep |
|||
|last2=Ghosh |
|||
|first2=Subhodeep |
|||
|last3=Dawn |
|||
|first3=Subham |
|||
|last4=Hore |
|||
|first4=Sirshendu |
|||
|last5=Dey |
|||
|first5=Nilanjan |
|||
|date=2016 |
|||
|series=Advances in Intelligent Systems and Computing |
|||
|publisher=Springer India |
|||
|location=New Delhi |
|||
|pages=227–236 |
|||
|isbn=978-81-322-2756-4 |
|||
}}</ref> |
|||
|B. Johnson |
|B. Johnson |
||
|- |
|- |
||
Рядок 893: | Рядок 1017: | ||
|Класифікація |
|Класифікація |
||
|2009 |
|2009 |
||
|<ref>{{Cite news|title=A combinatorial method for tracing objects using semantics of their shape|url=http://dx.doi.org/10.1109/aipr.2010.5759716|publisher=IEEE|work=2010 IEEE 39th Applied Imagery Pattern Recognition Workshop (AIPR)|date=2010-10|accessdate=2022-05-20|doi=10.1109/aipr.2010.5759716|first=Carl|last=Diegert}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/877840527 |
|||
|title=Small Target Detection combining Foreground and Background Manifolds |
|||
|last=Frédéric |
|||
|first=Razakarivony, Sebastien Jurie, |
|||
|oclc=877840527 |
|||
}}</ref> |
|||
|F. Tanner et al. |
|F. Tanner et al. |
||
|- |
|- |
||
Рядок 903: | Рядок 1033: | ||
|Класифікація, ідентифікація об'єкта |
|Класифікація, ідентифікація об'єкта |
||
|2017 |
|2017 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/978-1-4842-6919-0_3 |
|||
|title=Getting Started with Databricks |
|||
|last=Ilijason |
|||
|first=Robert |
|||
|date=2021 |
|||
|series=Getting Started with Databricks |
|||
|publisher=Apress |
|||
|location=Berkeley, CA |
|||
|isbn=978-1-4842-6919-0 |
|||
}}</ref><ref>{{Cite news|title=Integrating edge/boundary priors with classification scores for building detection in very high resolution data|url=http://ieeexplore.ieee.org/document/8127705/|publisher=IEEE|work=2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS)|date=2017-07|accessdate=2022-05-20|isbn=978-1-5090-4951-6|doi=10.1109/IGARSS.2017.8127705|pages=3309–3312|first=Maria|last=Vakalopoulou|first2=Norbert|last2=Bus|first3=Konstantinos|last3=Karantzalos|first4=Nikos|last4=Paragios}}</ref> |
|||
|DigitalGlobe, Inc. |
|DigitalGlobe, Inc. |
||
|- |
|- |
||
Рядок 923: | Рядок 1063: | ||
|Класифікація |
|Класифікація |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=DeepSat: a learning framework for satellite imagery|url=https://dl.acm.org/doi/10.1145/2820783.2820816|publisher=ACM|work=Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems|date=2015-11-03|accessdate=2022-05-20|isbn=978-1-4503-3967-4|doi=10.1145/2820783.2820816|pages=1–10|language=en|first=Saikat|last=Basu|first2=Sangram|last2=Ganguly|first3=Supratik|last3=Mukhopadhyay|first4=Robert|last4=DiBiano|first5=Manohar|last5=Karki|first6=Ramakrishna|last6=Nemani}}</ref><ref>{{Cite news|title=DeepSat V2: feature augmented convolutional neural nets for satellite image classification|url=https://doi.org/10.1080/2150704X.2019.1693071|work=Remote Sensing Letters|date=2020-02-01|accessdate=2022-05-20|issn=2150-704X|doi=10.1080/2150704X.2019.1693071|pages=156–165|volume=11|issue=2|first=Qun|last=Liu|first2=Saikat|last2=Basu|first3=Sangram|last3=Ganguly|first4=Supratik|last4=Mukhopadhyay|first5=Robert|last5=DiBiano|first6=Manohar|last6=Karki|first7=Ramakrishna|last7=Nemani}}</ref> |
|||
| |
|||
|S. Basu et al. |
|S. Basu et al. |
||
|- |
|- |
||
Рядок 933: | Рядок 1073: | ||
|Класифікація |
|Класифікація |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=DeepSat: a learning framework for satellite imagery|url=https://dl.acm.org/doi/10.1145/2820783.2820816|publisher=ACM|work=Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems|date=2015-11-03|accessdate=2022-05-20|isbn=978-1-4503-3967-4|doi=10.1145/2820783.2820816|pages=1–10|language=en|first=Saikat|last=Basu|first2=Sangram|last2=Ganguly|first3=Supratik|last3=Mukhopadhyay|first4=Robert|last4=DiBiano|first5=Manohar|last5=Karki|first6=Ramakrishna|last6=Nemani}}</ref><ref>{{Cite news|title=DeepSat V2: feature augmented convolutional neural nets for satellite image classification|url=https://www.tandfonline.com/doi/full/10.1080/2150704X.2019.1693071|work=Remote Sensing Letters|date=2020-02-01|accessdate=2022-05-20|issn=2150-704X|doi=10.1080/2150704X.2019.1693071|pages=156–165|volume=11|issue=2|language=en|first=Qun|last=Liu|first2=Saikat|last2=Basu|first3=Sangram|last3=Ganguly|first4=Supratik|last4=Mukhopadhyay|first5=Robert|last5=DiBiano|first6=Manohar|last6=Karki|first7=Ramakrishna|last7=Nemani}}</ref> |
|||
| |
|||
|S. Basu et al. |
|S. Basu et al. |
||
|} |
|} |
||
Рядок 956: | Рядок 1096: | ||
|Класифікація |
|Класифікація |
||
|2021 |
|2021 |
||
|<ref>{{Cite news|title=The influence of oxyhemoglobin affinity on tissue oxygen consumption|url=https://pubmed.ncbi.nlm.nih.gov/2111|work=Annals of Surgery|date=1976-02|accessdate=2022-05-20|issn=0003-4932|pmc=1344074|pmid=2111|doi=10.1097/00000658-197602000-00008|pages=130–135|volume=183|issue=2|first=A. H.|last=Harken|first2=M.|last2=Woods}}</ref><ref>{{Citation|title=The gas meter image dataset (NRC-GAMMA)|url=https://nrc-digital-repository.canada.ca/eng/view/object/?id=ba1fc493-e65f-4c0a-ab31-ecbcdf00bfa4|publisher=National Research Council of Canada|date=2021-11-19|accessdate=2022-05-20|doi=10.4224/3c8s-z290|language=en|first=Ashkan|last=Ebadi|first2=Patrick|last2=Paul|first3=Sofia|last3=Auer|first4=Stéphane|last4=Tremblay}}</ref> |
|||
| |
|||
|A. Ebadi, P. Paul, S. Auer, & S. Tremblay |
|A. Ebadi, P. Paul, S. Auer, & S. Tremblay |
||
|- |
|- |
||
Рядок 966: | Рядок 1106: | ||
|Ідентифікація вихідного пристрою, виявлення підробок, класифікація,... |
|Ідентифікація вихідного пристрою, виявлення підробок, класифікація,... |
||
|2020 |
|2020 |
||
|<ref>{{Cite news|title=The Supatlantique Scanned Documents Database for Digital Image Forensics Purposes|url=http://dx.doi.org/10.1109/icip40778.2020.9190665|publisher=IEEE|work=2020 IEEE International Conference on Image Processing (ICIP)|date=2020-10|accessdate=2022-05-20|doi=10.1109/icip40778.2020.9190665|first=Chaima Ben|last=Rabah|first2=Gouenou|last2=Coatrieux|first3=Riadh|last3=Abdelfattah}}</ref><ref>{{Citation|title=Big graphene dataset|url=https://nrc-digital-repository.canada.ca/eng/view/object/?id=9f09901d-0736-4204-a35d-0c88ffb8da3b|publisher=National Research Council of Canada|date=2019-03-12|accessdate=2022-05-20|doi=10.4224/c8sc04578j.data|language=en|first=Kyle|last=Mills|first2=Isaac|last2=Tamblyn}}</ref> |
|||
| |
|||
|C. Ben Rabah et al. |
|C. Ben Rabah et al. |
||
|- |
|- |
||
Рядок 976: | Рядок 1116: | ||
|Регресія |
|Регресія |
||
|2019 |
|2019 |
||
|<ref>{{Citation|title=Big graphene dataset|url=https://nrc-digital-repository.canada.ca/eng/view/object/?id=9f09901d-0736-4204-a35d-0c88ffb8da3b|publisher=National Research Council of Canada|date=2019-03-12|accessdate=2022-05-20|doi=10.4224/c8sc04578j.data|language=en|first=Kyle|last=Mills|first2=Isaac|last2=Tamblyn}}</ref> |
|||
| |
|||
|K. Mills & I. Tamblyn |
|K. Mills & I. Tamblyn |
||
|- |
|- |
||
Рядок 986: | Рядок 1126: | ||
|Регресія |
|Регресія |
||
|2017 |
|2017 |
||
|<ref>{{Citation|title=Quantum simulations of an electron in a two dimensional potential well|url=https://nrc-digital-repository.canada.ca/eng/view/object/?id=1343ae23-cebf-45c6-94c3-ddebdb2f23c6|publisher=National Research Council of Canada|date=2018-05-18|accessdate=2022-05-20|doi=10.4224/physreva.96.042113.data|language=en|first=Kyle|last=Mills|first2=Michael|last2=Spanner|first3=Isaac|last3=Tamblyn}}</ref> |
|||
| |
|||
|K. Mills, M.A. Spanner, & I. Tamblyn |
|K. Mills, M.A. Spanner, & I. Tamblyn |
||
|- |
|- |
||
Рядок 996: | Рядок 1136: | ||
|Класифікація |
|Класифікація |
||
|2012 |
|2012 |
||
|<ref>{{Cite news|title=A database for fine grained activity detection of cooking activities|url=https://ieeexplore.ieee.org/document/6247801/|work=2012 IEEE Conference on Computer Vision and Pattern Recognition|date=2012-06|accessdate=2022-05-20|doi=10.1109/CVPR.2012.6247801|pages=1194–1201|first=Marcus|last=Rohrbach|first2=Sikandar|last2=Amin|first3=Mykhaylo|last3=Andriluka|first4=Bernt|last4=Schiele}}</ref><ref>{{Cite news|title=The Language of Actions: Recovering the Syntax and Semantics of Goal-Directed Human Activities|url=http://dx.doi.org/10.1109/cvpr.2014.105|publisher=IEEE|work=2014 IEEE Conference on Computer Vision and Pattern Recognition|date=2014-06|accessdate=2022-05-20|doi=10.1109/cvpr.2014.105|first=Hilde|last=Kuehne|first2=Ali|last2=Arslan|first3=Thomas|last3=Serre}}</ref> |
|||
| |
|||
|M. Rohrbach et al. |
|M. Rohrbach et al. |
||
|- |
|- |
||
Рядок 1006: | Рядок 1146: | ||
|Аутентифікація |
|Аутентифікація |
||
|2012 |
|2012 |
||
|<ref>{{Cite news|title=A database for fine grained activity detection of cooking activities|url=https://ieeexplore.ieee.org/document/6247801/|work=2012 IEEE Conference on Computer Vision and Pattern Recognition|date=2012-06|accessdate=2022-05-20|doi=10.1109/CVPR.2012.6247801|pages=1194–1201|first=Marcus|last=Rohrbach|first2=Sikandar|last2=Amin|first3=Mykhaylo|last3=Andriluka|first4=Bernt|last4=Schiele}}</ref> |
|||
| |
|||
|S. Voloshynovskiy, et al. |
|S. Voloshynovskiy, et al. |
||
|- |
|- |
||
Рядок 1016: | Рядок 1156: | ||
|Дрібнозерниста класифікація |
|Дрібнозерниста класифікація |
||
|2017 |
|2017 |
||
|<ref>{{Cite news|title=PharmaPack: Mobile fine-grained recognition of pharma packages|url=http://dx.doi.org/10.23919/eusipco.2017.8081543|publisher=IEEE|work=2017 25th European Signal Processing Conference (EUSIPCO)|date=2017-08|accessdate=2022-05-20|doi=10.23919/eusipco.2017.8081543|first=O.|last=Taran|first2=S.|last2=Rezaeifar|first3=O.|last3=Dabrowski|first4=J.|last4=Schlechten|first5=T.|last5=Holotyak|first6=S.|last6=Voloshynovskiy}}</ref> |
|||
| |
|||
|O. Taran and S. Rezaeifar, et al. |
|O. Taran and S. Rezaeifar, et al. |
||
|- |
|- |
||
Рядок 1026: | Рядок 1166: | ||
|Дрібнозерниста класифікація |
|Дрібнозерниста класифікація |
||
|2011 |
|2011 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1228414137 |
|||
|title=FenceMask: A Data Augmentation Approach for Pre-extracted Image Features |
|||
|last=Xiang |
|||
|first=Li, Pu Li, Xiangyang Long, |
|||
|date=2020-06-14 |
|||
|oclc=1228414137 |
|||
}}</ref><ref>{{Cite book |
|||
|url=http://dx.doi.org/10.1002/9781118689691.ch5 |
|||
|title=Diagnosis |
|||
|date=2015-05-01 |
|||
|series=Seizures in Dogs and Cats |
|||
|publisher=John Wiley & Sons, Inc |
|||
|location=Hoboken, NJ |
|||
|pages=94–128 |
|||
|isbn=978-1-118-68969-1 |
|||
}}</ref> |
|||
|A. Khosla et al. |
|A. Khosla et al. |
||
|- |
|- |
||
Рядок 1036: | Рядок 1192: | ||
|3D реконструкція/оцінка пози |
|3D реконструкція/оцінка пози |
||
|2020 |
|2020 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/978-3-030-58621-8_12 |
|||
|title=Who Left the Dogs Out? 3D Animal Reconstruction with Expectation Maximization in the Loop |
|||
|last=Biggs |
|||
|first=Benjamin |
|||
|last2=Boyne |
|||
|first2=Oliver |
|||
|last3=Charles |
|||
|first3=James |
|||
|last4=Fitzgibbon |
|||
|first4=Andrew |
|||
|last5=Cipolla |
|||
|first5=Roberto |
|||
|date=2020 |
|||
|series=Computer Vision – ECCV 2020 |
|||
|publisher=Springer International Publishing |
|||
|location=Cham |
|||
|pages=195–211 |
|||
|isbn=978-3-030-58620-1 |
|||
}}</ref> |
|||
|B. Biggs et al. |
|B. Biggs et al. |
||
|- |
|- |
||
Рядок 1046: | Рядок 1221: | ||
|Класифікація, виявлення об'єктів |
|Класифікація, виявлення об'єктів |
||
|2012 |
|2012 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1233686320 |
|||
|title=CNN features off-the-shelf : An Astounding Baseline for Recognition |
|||
|last=Stefan |
|||
|first=Sharif Razavian, Ali Azizpour, Hossein Sullivan, Josephine Carlsson, |
|||
|date=2014 |
|||
|publisher=KTH, Datorseende och robotik, CVAP |
|||
|oclc=1233686320 |
|||
}}</ref><ref>{{Cite book |
|||
|url=http://dx.doi.org/10.1002/9781118689691.ch5 |
|||
|title=Diagnosis |
|||
|date=2015-05-01 |
|||
|series=Seizures in Dogs and Cats |
|||
|publisher=John Wiley & Sons, Inc |
|||
|location=Hoboken, NJ |
|||
|pages=94–128 |
|||
|isbn=978-1-118-68969-1 |
|||
}}</ref> |
|||
|O. Parkhi et al. |
|O. Parkhi et al. |
||
|- |
|- |
||
Рядок 1056: | Рядок 1248: | ||
|Класифікація, виявлення об'єктів |
|Класифікація, виявлення об'єктів |
||
|1999 |
|1999 |
||
|<ref>{{Cite news|title=Supporting ranked Boolean similarity queries in MARS|url=http://ieeexplore.ieee.org/document/738357/|work=IEEE Transactions on Knowledge and Data Engineering|date=Nov.-Dec./1998|accessdate=2022-05-20|doi=10.1109/69.738357|pages=905–925|volume=10|issue=6|first=M.|last=Ortega|first2=Y.|last2=Rui|first3=K.|last3=Chakrabarti|first4=K.|last4=Porkaew|first5=S.|last5=Mehrotra|first6=T.S.|last6=Huang}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/811773023 |
|||
|title=Medical image computing and computer-assisted intervention--MICCAI 2012. 15th International Conference, Nice, France, October 1-5, 2012, Proceedings |
|||
|last=France) |
|||
|first=International Conference on Medical Image Computing and Computer-Assisted Intervention (15th : 2012 : Nice, |
|||
|date=2012 |
|||
|publisher=Springer |
|||
|isbn=978-3-642-33418-4 |
|||
|oclc=811773023 |
|||
}}</ref> |
|||
|M. Ortega-Bindenberger et al. |
|M. Ortega-Bindenberger et al. |
||
|- |
|- |
||
Рядок 1066: | Рядок 1267: | ||
|Регресія |
|Регресія |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=Video transcoding time prediction for proactive load balancing|url=http://dx.doi.org/10.1109/icme.2014.6890256|publisher=IEEE|work=2014 IEEE International Conference on Multimedia and Expo (ICME)|date=2014-07|accessdate=2022-05-20|doi=10.1109/icme.2014.6890256|first=Tewodors|last=Deneke|first2=Habtegebreil|last2=Haile|first3=Sebastien|last3=Lafond|first4=Johan|last4=Lilius}}</ref> |
|||
| |
|||
|T. Deneke et al. |
|T. Deneke et al. |
||
|- |
|- |
||
Рядок 1076: | Рядок 1277: | ||
|Візуальне оповідання |
|Візуальне оповідання |
||
|2016 |
|2016 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.3726/978-3-653-03968-9/3 |
|||
|title=10.3726/978-3-653-03968-9/3 |
|||
|series=Inactive DOIs |
|||
|publisher=CrossRef |
|||
}}</ref> |
|||
|Microsoft Research |
|Microsoft Research |
||
|- |
|- |
||
Рядок 1086: | Рядок 1292: | ||
|Класифікація |
|Класифікація |
||
|2011 |
|2011 |
||
|<ref>{{Cite web|url=http://dx.doi.org/10.7287/peerj.preprints.27138/supp-1|website=Supplemental Information 1: Datase 1|accessdate=2022-05-20}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1127139088 |
|||
|title=Computational methods for integrating vision and language |
|||
|last=author. |
|||
|first=Barnard, Kobus., |
|||
|isbn=1-60845-113-5 |
|||
|oclc=1127139088 |
|||
}}</ref> |
|||
|C. Wah et al. |
|C. Wah et al. |
||
|- |
|- |
||
Рядок 1096: | Рядок 1309: | ||
|Класифікація відео |
|Класифікація відео |
||
|2016 |
|2016 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/978-3-030-11018-5_29 |
|||
|title=Approach for Video Classification with Multi-label on YouTube-8M Dataset |
|||
|last=Shin |
|||
|first=Kwangsoo |
|||
|last2=Jeon |
|||
|first2=Junhyeong |
|||
|last3=Lee |
|||
|first3=Seungbin |
|||
|last4=Lim |
|||
|first4=Boyoung |
|||
|last5=Jeong |
|||
|first5=Minsoo |
|||
|last6=Nang |
|||
|first6=Jongho |
|||
|date=2019 |
|||
|series=Lecture Notes in Computer Science |
|||
|publisher=Springer International Publishing |
|||
|location=Cham |
|||
|pages=317–324 |
|||
|isbn=978-3-030-11017-8 |
|||
}}</ref><ref>{{Cite news|title=OpenArXiv = arXiv + RDBMS + web services|url=http://dx.doi.org/10.1145/1141753.1141870|publisher=ACM Press|work=Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries - JCDL '06|date=2006|accessdate=2022-05-20|doi=10.1145/1141753.1141870|first=Justin|last=Fisher|first2=Hyunyoung|last2=Kil|first3=Dongwon|last3=Lee}}</ref> |
|||
|S. Abu-El-Haija et al. |
|S. Abu-El-Haija et al. |
||
|- |
|- |
||
Рядок 1106: | Рядок 1340: | ||
|Класифікація відео та зображень |
|Класифікація відео та зображень |
||
|2016 |
|2016 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1204141741 |
|||
|title=Deep Learning mit TensorFlow, Keras und TensorFlow.js |
|||
|last=Matthieu. |
|||
|first=Deru, |
|||
|date=2020 |
|||
|publisher=Rheinwerk Verlag |
|||
|isbn=978-3-8362-7427-2 |
|||
|oclc=1204141741 |
|||
}}</ref><ref>{{Cite news|title=YFCC100M: the new data in multimedia research|url=https://dl.acm.org/doi/10.1145/2812802|work=Communications of the ACM|date=2016-01-25|accessdate=2022-05-20|issn=0001-0782|doi=10.1145/2812802|pages=64–73|volume=59|issue=2|language=en|first=Bart|last=Thomee|first2=David A.|last2=Shamma|first3=Gerald|last3=Friedland|first4=Benjamin|last4=Elizalde|first5=Karl|last5=Ni|first6=Douglas|last6=Poland|first7=Damian|last7=Borth|first8=Li-Jia|last8=Li}}</ref> |
|||
|B. Thomee et al. |
|B. Thomee et al. |
||
|- |
|- |
||
Рядок 1116: | Рядок 1359: | ||
|Відео виявлення емоцій |
|Відео виявлення емоцій |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=LIRIS-ACCEDE: A Video Database for Affective Content Analysis|url=http://dx.doi.org/10.1109/taffc.2015.2396531|work=IEEE Transactions on Affective Computing|date=2015-01-01|accessdate=2022-05-20|issn=1949-3045|doi=10.1109/taffc.2015.2396531|pages=43–55|volume=6|issue=1|first=Yoann|last=Baveye|first2=Emmanuel|last2=Dellandrea|first3=Christel|last3=Chamaret|last4=Liming Chen}}</ref> |
|||
| |
|||
|Y. Baveye et al. |
|Y. Baveye et al. |
||
|- |
|- |
||
Рядок 1126: | Рядок 1369: | ||
|Відео виявлення емоцій |
|Відео виявлення емоцій |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=Deep learning vs. kernel methods: Performance for emotion prediction in videos|url=http://dx.doi.org/10.1109/acii.2015.7344554|publisher=IEEE|work=2015 International Conference on Affective Computing and Intelligent Interaction (ACII)|date=2015-09|accessdate=2022-05-20|doi=10.1109/acii.2015.7344554|first=Yoann|last=Baveye|first2=Emmanuel|last2=Dellandrea|first3=Christel|last3=Chamaret|first4=Liming|last4=Chen}}</ref> |
|||
| |
|||
|Y. Baveye et al. |
|Y. Baveye et al. |
||
|- |
|- |
||
Рядок 1136: | Рядок 1379: | ||
|Відео виявлення емоцій |
|Відео виявлення емоцій |
||
|2015 |
|2015 |
||
|<ref>{{Cite news|title=Imbalance Learning-based Framework for Fear Recognition in the MediaEval Emotional Impact of Movies Task|url=http://dx.doi.org/10.21437/interspeech.2018-1744|publisher=ISCA|work=Interspeech 2018|date=2018-09-02|accessdate=2022-05-20|doi=10.21437/interspeech.2018-1744|first=Xiaotong|last=Zhang|first2=Xingliang|last2=Cheng|first3=Mingxing|last3=Xu|first4=Thomas Fang|last4=Zheng}}</ref> |
|||
| |
|||
|Y. Baveye et al. |
|Y. Baveye et al. |
||
|- |
|- |
||
Рядок 1146: | Рядок 1389: | ||
|Оцінка пози людини |
|Оцінка пози людини |
||
|2010 |
|2010 |
||
|<ref>{{Cite news|title=Clustered Pose and Nonlinear Appearance Models for Human Pose Estimation|url=http://dx.doi.org/10.5244/c.24.12|publisher=British Machine Vision Association|work=Procedings of the British Machine Vision Conference 2010|date=2010|accessdate=2022-05-20|doi=10.5244/c.24.12|first=Sam|last=Johnson|first2=Mark|last2=Everingham}}</ref> |
|||
| |
|||
|S. Johnson and M. Everingham |
|S. Johnson and M. Everingham |
||
|- |
|- |
||
Рядок 1156: | Рядок 1399: | ||
|Оцінка пози людини |
|Оцінка пози людини |
||
|2011 |
|2011 |
||
|<ref>{{Cite news|title=Learning effective human pose estimation from inaccurate annotation|url=http://dx.doi.org/10.1109/cvpr.2011.5995318|publisher=IEEE|work=CVPR 2011|date=2011-06|accessdate=2022-05-20|doi=10.1109/cvpr.2011.5995318|first=Sam|last=Johnson|first2=Mark|last2=Everingham}}</ref> |
|||
| |
|||
|S. Johnson and M. Everingham |
|S. Johnson and M. Everingham |
||
|- |
|- |
||
Рядок 1166: | Рядок 1409: | ||
|Розробка систем оцінювання тестів із множинним вибором |
|Розробка систем оцінювання тестів із множинним вибором |
||
|2017 |
|2017 |
||
|<ref>{{Cite news|title=Reports of six individual workshops|url=https://pubmed.ncbi.nlm.nih.gov/1711|work=Nursing Mirror and Midwives Journal|date=1976-01-08|accessdate=2022-05-20|issn=0143-2524|pmid=1711|pages=56–59|volume=142|issue=2}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1106232721 |
|||
|title=TabMCQ: A Dataset of General Knowledge Tables and Multiple-choice Questions |
|||
|last=Eduard |
|||
|first=Jauhar, Sujay Kumar Turney, Peter Hovy, |
|||
|date=2016-02-11 |
|||
|oclc=1106232721 |
|||
}}</ref> |
|||
|Afifi, M. et al. |
|Afifi, M. et al. |
||
|- |
|- |
||
Рядок 1176: | Рядок 1426: | ||
|Стиснення даних |
|Стиснення даних |
||
|2016 |
|2016 |
||
|<ref>{{Cite news|title=A new compression technique for surveillance videos: Evaluation using new dataset|url=http://ieeexplore.ieee.org/document/7544020/|publisher=IEEE|work=2016 Sixth International Conference on Digital Information and Communication Technology and its Applications (DICTAP)|date=2016-07|accessdate=2022-05-20|isbn=978-1-4673-9609-7|doi=10.1109/DICTAP.2016.7544020|pages=159–164|first=Islam A.T.F.|last=Taj-Eddin|first2=Mahmoud|last2=Afifi|first3=Mostafa|last3=Korashy|first4=Doha|last4=Hamdy|first5=Marwa|last5=Nasser|first6=Shimaa|last6=Derbaz}}</ref> |
|||
| |
|||
|Taj-Eddin, I. A. T. F. et al. |
|Taj-Eddin, I. A. T. F. et al. |
||
|- |
|- |
||
Рядок 1186: | Рядок 1436: | ||
|Класифікація |
|Класифікація |
||
|2019 |
|2019 |
||
|<ref>{{Cite news|title=Machine learning to classify animal species in camera trap images: Applications in ecology|url=https://onlinelibrary.wiley.com/doi/10.1111/2041-210X.13120|work=Methods in Ecology and Evolution|date=2019-04|accessdate=2022-05-20|issn=2041-210X|doi=10.1111/2041-210X.13120|pages=585–590|volume=10|issue=4|language=en|first=Michael A.|last=Tabak|first2=Mohammad S.|last2=Norouzzadeh|first3=David W.|last3=Wolfson|first4=Steven J.|last4=Sweeney|first5=Kurt C.|last5=Vercauteren|first6=Nathan P.|last6=Snow|first7=Joseph M.|last7=Halseth|first8=Paul A.|last8=Di Salvo|first9=Jesse S.|last9=Lewis|editor-first=Theoni|editor-last=Photopoulou}}</ref> |
|||
| |
|||
|LILA working group |
|LILA working group |
||
|- |
|- |
||
Рядок 1196: | Рядок 1446: | ||
|Виявлення живості рослин |
|Виявлення живості рослин |
||
|2017 |
|2017 |
||
|<ref>{{Cite news|title=Can we see photosynthesis? Magnifying the tiny color changes of plant green leaves using Eulerian video magnification|url=https://www.spiedigitallibrary.org/journals/journal-of-electronic-imaging/volume-26/issue-06/060501/Can-we-see-photosynthesis-Magnifying-the-tiny-color-changes-of/10.1117/1.JEI.26.6.060501.full|work=Journal of Electronic Imaging|date=2017-11-02|accessdate=2022-05-20|issn=1017-9909|doi=10.1117/1.JEI.26.6.060501|pages=1|volume=26|issue=06|first=Islam A. T. F.|last=Taj-Eddin}}</ref> |
|||
| |
|||
|Taj-Eddin, I. A. T. F. et al. |
|Taj-Eddin, I. A. T. F. et al. |
||
|- |
|- |
||
Рядок 1206: | Рядок 1456: | ||
|Візуальне оповідання, виявлення об’єктів. |
|Візуальне оповідання, виявлення об’єктів. |
||
|2021 |
|2021 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1043395986 |
|||
|title=An anthropology of puzzles : the role of puzzles in the origins and evolution of mind and culture |
|||
|last=author. |
|||
|first=Danesi, Marcel, 1946- |
|||
|isbn=978-1-350-08985-3 |
|||
|oclc=1043395986 |
|||
}}</ref> |
|||
|Mathematical Mathematics Memes |
|Mathematical Mathematics Memes |
||
|} |
|} |
||
Рядок 1232: | Рядок 1489: | ||
|Класифікація, аналіз настроїв |
|Класифікація, аналіз настроїв |
||
|2015 (2018) |
|2015 (2018) |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/1106220231 |
|||
|title=Image-based Recommendations on Styles and Substitutes |
|||
|last=den |
|||
|first=McAuley, Julian Targett, Christopher Shi, Qinfeng Hengel, Anton van |
|||
|date=2015-06-15 |
|||
|oclc=1106220231 |
|||
}}</ref><ref>{{Cite book |
|||
|url=http://worldcat.org/oclc/1140410786 |
|||
|title=TEAS review |
|||
|last=author. |
|||
|first=Cantarella, Cara, |
|||
|isbn=978-1-260-46239-5 |
|||
|oclc=1140410786 |
|||
}}</ref> |
|||
|McAuley et al. |
|McAuley et al. |
||
|- |
|- |
||
Рядок 1242: | Рядок 1513: | ||
|Аналіз настроїв, кластеризація |
|Аналіз настроїв, кластеризація |
||
|2011 |
|2011 |
||
|<ref>{{Cite news|title=Opinion-based entity ranking|url=http://link.springer.com/10.1007/s10791-011-9174-8|work=Information Retrieval|date=2012-04|accessdate=2022-05-20|issn=1386-4564|doi=10.1007/s10791-011-9174-8|pages=116–150|volume=15|issue=2|language=en|first=Kavita|last=Ganesan|first2=ChengXiang|last2=Zhai}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/851389904 |
|||
|title=Advances in swarm intelligence : 4th International Conference, ICSI 2013, Harbin, China, June 12-15, 2013, proceedings |
|||
|last=China) |
|||
|first=ICSI (Conference) (4th : 2013 : Harbin, |
|||
|isbn=978-3-642-38702-9 |
|||
|oclc=851389904 |
|||
}}</ref> |
|||
|K. Ganesan et al. |
|K. Ganesan et al. |
||
|- |
|- |
||
Рядок 1252: | Рядок 1530: | ||
|Регресія, кластеризація, класифікація |
|Регресія, кластеризація, класифікація |
||
|2016 |
|2016 |
||
|<ref>{{Cite news|title=The MovieLens Datasets: History and Context|url=https://dl.acm.org/doi/10.1145/2827872|work=ACM Transactions on Interactive Intelligent Systems|date=2016-01-07|accessdate=2022-05-20|issn=2160-6455|doi=10.1145/2827872|pages=1–19|volume=5|issue=4|language=en|first=F. Maxwell|last=Harper|first2=Joseph A.|last2=Konstan}}</ref> |
|||
| |
|||
|GroupLens Research |
|GroupLens Research |
||
|- |
|- |
||
Рядок 1262: | Рядок 1540: | ||
|Класифікація, регресія |
|Класифікація, регресія |
||
|2004 |
|2004 |
||
|<ref>{{Cite news|title=Yahoo! music recommendations|url=http://dx.doi.org/10.1145/2043932.2043964|publisher=ACM Press|work=Proceedings of the fifth ACM conference on Recommender systems - RecSys '11|date=2011|accessdate=2022-05-20|doi=10.1145/2043932.2043964|first=Noam|last=Koenigstein|first2=Gideon|last2=Dror|first3=Yehuda|last3=Koren}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/875517979 |
|||
|title=Towards a linked semantic web: Precisely, comprehensively and scalably linking heterogeneous data in the semantic web. |
|||
|last=Dezhao. |
|||
|first=Song, |
|||
|date=2014 |
|||
|isbn=978-1-303-66041-2 |
|||
|oclc=875517979 |
|||
}}</ref> |
|||
|Yahoo! |
|Yahoo! |
||
|- |
|- |
||
Рядок 1272: | Рядок 1558: | ||
|Класифікація |
|Класифікація |
||
|1997 |
|1997 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://dx.doi.org/10.1007/3-540-36187-1_12 |
|||
|title=MML Inference of Decision Graphs with Multi-way Joins |
|||
|last=Tan |
|||
|first=Peter J. |
|||
|last2=Dowe |
|||
|first2=David L. |
|||
|date=2002 |
|||
|series=Lecture Notes in Computer Science |
|||
|publisher=Springer Berlin Heidelberg |
|||
|location=Berlin, Heidelberg |
|||
|pages=131–142 |
|||
|isbn=978-3-540-00197-3 |
|||
}}</ref> |
|||
|M. Bohanec |
|M. Bohanec |
||
|- |
|- |
||
Рядок 1282: | Рядок 1581: | ||
|Класифікація |
|Класифікація |
||
|2012 |
|2012 |
||
|<ref>{{Cite news|title=Where lol Is: Function and Position of lol Used as a Discourse Marker in YouTube Comments|url=http://dx.doi.org/10.4000/discours.10900|work=Discours|date=2020-12-23|accessdate=2022-05-20|issn=1963-1723|doi=10.4000/discours.10900|issue=27|first=Célia|last=Schneebeli}}</ref><ref>{{Cite book |
|||
| |
|||
|url=http://link.springer.com/10.1007/978-3-642-32692-9_63 |
|||
|title=A Classifier for Big Data |
|||
|last=Kim |
|||
|first=Byung Joo |
|||
|date=2012 |
|||
|editor-last=Lee |
|||
|editor-first=Geuk |
|||
|editor2-last=Howard |
|||
|editor2-first=Daniel |
|||
|editor3-last=Ślęzak |
|||
|editor3-first=Dominik |
|||
|editor4-last=Hong |
|||
|editor4-first=You Sik |
|||
|series=Convergence and Hybrid Information Technology |
|||
|publisher=Springer Berlin Heidelberg |
|||
|volume=310 |
|||
|location=Berlin, Heidelberg |
|||
|pages=505–512 |
|||
|language=en |
|||
|doi=10.1007/978-3-642-32692-9_63 |
|||
|isbn=978-3-642-32691-2 |
|||
}}</ref> |
|||
|Google |
|Google |
||
|- |
|- |
||
Рядок 1292: | Рядок 1613: | ||
|Класифікація, регресія |
|Класифікація, регресія |
||
|2015 |
|2015 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/754949191 |
|||
|title=Predicting Skytrax airport rankings from customer reviews |
|||
|last=D. |
|||
|first=Pérezgonzález, Jose |
|||
|oclc=754949191 |
|||
}}</ref> |
|||
|Q. Nguyen |
|Q. Nguyen |
||
|- |
|- |
||
Рядок 1302: | Рядок 1629: | ||
|Класифікація |
|Класифікація |
||
|1997 |
|1997 |
||
|<ref>{{Cite book |
|||
| |
|||
|url=http://worldcat.org/oclc/878051089 |
|||
|title=Combining pattern classifiers : methods and algorithms |
|||
|last=1959- |
|||
|first=Kuncheva, Ludmila I. (Ludmila Ilieva), |
|||
|isbn=978-1-118-91454-0 |
|||
|oclc=878051089 |
|||
}}</ref> |
|||
|W. Loh et al. |
|W. Loh et al. |
||
|- |
|- |
Версія за 11:07, 20 травня 2022
В іншому мовному розділі є повніша стаття List of datasets for machine learning research(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою перекладу з англійської. (травень 2017)
|
Ця стаття є сирим перекладом з іншої мови. Можливо, вона створена за допомогою машинного перекладу або перекладачем, який недостатньо володіє обома мовами. (червень 2017) |
Набори даних використовуються для дослідження машинного навчання, посилання на них використовуються в наукових академічних статтях. Набори даних є невід’ємною частиною галузі машинного навчання. Значні досягнення в цій галузі можуть бути результатом прогресу в алгоритмах навчання (наприклад, deep learning), комп'ютерного обладнання та, що не так очевидно, доступності високоякісних наборів навчальних даних. Високоякісні марковані навчальні набори даних для алгоритмів машинного навчання під наглядом і напівнаглядом зазвичай важко та дорого створити через велику кількість часу, необхідного для позначення даних. Хоча їх не потрібно позначати, високоякісні набори даних для навчання без нагляду також може бути складним і дорогим у створенні. Набори даних орієнтовані, здебільшого, на вирішення задач класифікації та розпізнавання і містять оцифровані зображення, відео, тексти, сигнали, звуки тощо.
Данні зображення
Ці набори даних складаються переважно із зображень або відео використовуються для таких завдань, як виявлення об’єктів, розпізнавання обличчя та класифікація за кількома мітками.
Розпізнавання осіб
У комп’ютерному баченні зображення облич широко використовуються для розробки систем які розпізнають обличя та багатьох інших проектів.
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Face Recognition Technology (FERET) | 11338 зображень 1199 осіб у різних позиціях і в різний час. | Немає. | 11,338 | Зображення | Класифікація, розпізнавання обличчя | 2003 | [1][2] | United States Department of Defense |
CMU Pose, Illumination, and Expression (PIE) | 41 368 кольорових зображень 68 людей у 13 різних позах. | Зображення позначені виразами. | 41,368 | Зображення, текст | Класифікація, розпізнавання обличчя | 2000 | [3][4] | R. Gross et al. |
SCFace | Кольорові зображення облич під різними кутами. | Розташування виділених рис обличчя. Наведені координати об’єктів. | 4,160 | Зображення, текст | Класифікація, розпізнавання обличчя | 2011 | [5][6] | M. Grgic et al. |
YouTube Faces DB | З YouTube зібрано відео 1595 різних людей. Кожен кліп має від 48 до 6070 кадрів. | Ідентичність тих, хто з’являється у відео та дескрипторах. | 3,425 videos | Відео, текст | Класифікація відео, розпізнавання обличчя | 2011 | [7][8] | L. Wolf et al. |
300 videos in-the-Wild | 114 відео з анотаціями для відстеження орієнтирів обличчя. Розмітка 68 орієнтирів застосовується до кожного кадру. | Немає. | 114 videos, 218,000 frames. | Відео, файл анотації. | Відстеження орієнтирів обличчя. | 2015 | [9] | Shen, Jie et al. |
Grammatical Facial Expressions Dataset | Граматичні вирази обличчя з бразильської мови жестів. | Вилучено функції Microsoft Kinect. | 27,965 | Текст | Відстеження орієнтирів обличчя. | 2014 | [10] | F. Freitas et al. |
CMU Face Images Dataset | Зображення облич. Кожну людину фотографують кілька разів, щоб зафіксувати різні вирази обличчя. | Марка та особливості. | 640 | Зображення, текст | Розпізнавання обличчя | 1999 | [11][12] | T. Mitchell |
Yale Face Database | Обличчя 15 осіб у 11 різних виразах. | Маркування виразів. | 165 | Зображення | Розпізнавання обличчя | 1997 | [13][14] | J. Yang et al. |
Cohn-Kanade AU-Coded Expression Database | Велика база даних зображень з мітками для виразів. | Відстеження певних рис обличчя. | 500+ sequences | Зображення, текст | Аналіз виразу обличчя | 2000 | [15][16] | T. Kanade et al. |
FaceScrub | Зображення публічних діячів, видалені з пошуку зображень. | Назва та м/ж анотація. | 107,818 | Зображення, текст | Розпізнавання обличчя | 2014 | [17][18] | H. Ng et al. |
BioID Face Database | Зображення облич із позначеними положеннями очей. | Встановіть положення очей вручну. | 1521 | Зображення, текст | Розпізнавання обличчя | 2001 | [19][20] | BioID |
Skin Segmentation Dataset | Довільно відібрані значення кольорів із зображень облич. | B, G, R, значення витягнуті. | 245,057 | Текст | Сегментація, класифікація | 2012 | [21][22] | R. Bhatt. |
Bosphorus | База даних 3D зображень обличчя. | 34 action units and 6 expressions labeled; 24 facial landmarks labeled. | 4652 |
Зображення, текст |
Розпізнавання облич, класифікація | 2008 | [23][24] | A Savran et al. |
UOY 3D-Face | нейтральне обличчя, 5 виразів: гнів, щастя, смуток, очі закриті, брови підняті. | маркування. | 5250 |
Зображення, текст |
Розпізнавання облич, класифікація | 2004 | [25][26] | University of York |
CASIA | Вирази: гнів, посмішка, сміх, здивування, закриті очі. | Немає. | 4624 |
Зображення, текст |
Розпізнавання облич, класифікація | 2007 | [27][28] | Institute of Automation, Chinese Academy of Sciences |
CASIA | Вирази: Злість, Відраза, Страх, Щастя, Смуток, Подив. | Немає. | 480 | Відео з анотованим видимим спектром і ближнім інфрачервоним випромінюванням знімає зі швидкістю 25 кадрів в секунду | Розпізнавання облич, класифікація | 2011 | [29] | Zhao, G. et al. |
BU-3DFE | нейтральне обличчя і 6 виразів: гнів, щастя, смуток, здивування, огида, страх (4 рівні). Вилучено 3D-зображення. | Немає. | 2500 | Зображення, текст | Розпізнавання виразу обличчя, класифікація | 2006 | [30] | Binghamton University |
Face Recognition Grand Challenge Dataset | До 22 зразків для кожного предмета. Вирази: гнів, щастя, смуток, здивування, огида, роздутий. 3D дані. | Немає. | 4007 | Зображення, текст | Розпізнавання облич, класифікація | 2004 | [31][32] | National Institute of Standards and Technology |
Gavabdb | До 61 зразка для кожного предмета. Вирази обличчя нейтральні, посмішка, фронтальний акцентований сміх, фронтальний довільний жест. 3D зображення. | Немає. | 549 | Зображення, текст | Розпізнавання облич, класифікація | 2008 | [33][34] | King Juan Carlos University |
3D-RMA | До 100 предметів, вирази переважно нейтральні. Також кілька поз. | Немає. | 9971 | Зображення, текст | Розпізнавання облич, класифікація | 2004 | [35][36] | Royal Military Academy (Belgium) |
Розпізнавання дій
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
TV Human Interaction Dataset | Відео з 20 різних телевізійних шоу для прогнозування соціальних дій: рукостискання, п’ять, обійми, поцілунок. | Немає. | 6,766 відеокліпів | відеокліп | Прогноз дії | 2013 | [37] | Patron-Perez, A. et al. |
Berkeley Multimodal Human Action Database (MHAD) | Записи однієї особи, яка виконує 12 дій | Попередня обробка MoCap | 660 зразків дій | 8 Phase Space Motion Capture, 2 стереокамери, 4 чотирикамери, 6 акселерометрів, 4 мікрофони | Класифікація дій | 2013 | [38] | Ofli, F. et al. |
THUMOS Dataset | Великий набір відео даних для класифікації дій | Дії класифіковані та позначені. | 45 млн кадрів відео | Відео, зображення, текст | Класифікація, виявлення дії | 2013 | [39] | Y. Jiang et al. |
MEXAction2 | Набір відеоданих для локалізації дії та виявлення | Дії класифіковані та позначені. | 1000 | Відео | Виявлення дії | 2014 | [40] | Stoian et al. |
Виявлення та розпізнавання об'єктів
Назва | Опис | Обробка | Розмыр | Формат | Задачи | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Visual Genome | Зображення та їх опис | 108,000 | Зображення, текст | Підписи до зображень | 2016 | [41] | R. Krishna et al. | |
DAVIS: Densely Annotated VIdeo Segmentation 2017 | 150 відеопослідовностей, що містять 10459 кадрів із загалом 376 анотованими об’єктами. | Набір даних, опублікований для конкурсу DAVIS Challenge 2017 із спеціальним семінаром, розташованим разом із CVPR 2017. Відео містить кілька типів об’єктів і людей із високоякісною сегментацією анотації. У кожній відеопослідовності анотовано кілька екземплярів. | 10,459 | Рамки з анотаціями | Сегментація відеооб'єктів | 2017 | [42] | Pont-Tuset, J. et al. |
DAVIS: Densely Annotated VIdeo Segmentation 2016 | 50 відеопослідовностей, що містять 3455 кадрів із загалом 50 анотованими об’єктами. | Набір даних випущено разом із документом CVPR 2016. Відео містить кілька типів об’єктів і людей з високоякісною сегментацією анотації. У кожній відеопослідовності анотується один екземпляр. | 3,455 | Рамки з анотаціями | Сегментація відеооб'єктів | 2016 | [43] | Perazzi, F. et al. |
T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects | 30 галузевих об'єктів. 39 тис. навчальних і 10 тис. тестових зображень з кожного з трьох датчиків. Два типи 3D-моделей для кожного об’єкта. | 6D пози для всіх змодельованих об’єктів на всіх зображеннях. Попіксельне маркування можна отримати шляхом візуалізації моделей об’єктів у основних позах істини. | 49,000 | RGB-D зображення, 3D моделі об’єктів | 6D оцінка пози об'єкта, виявлення об'єкта | 2017 | [44] | T. Hodan et al. |
Berkeley 3-D Object Dataset | 849 зображень, зроблених у 75 різних сценах. Позначено близько 50 різних класів об’єктів. | Обмежувальні рамки та маркування об’єктів. | 849 | Марковані зображення, текст | Розпізнавання об'єктів | 2014 | [45][46] | A. Janoch et al. |
Berkeley Segmentation Data Set and Benchmarks 500 (BSDS500) | 500 природних зображень, чітко розділених на розрізнені потяги, підмножини перевірки та тестування + код порівняльного аналізу. На основі BSDS300. | Кожне зображення сегментовано в середньому за п’ятьма різними предметами. | 500 | Сегментовані зображення | Виявлення контурів та ієрархічна сегментація зображення | 2011 | [47] | University of California, Berkeley |
Microsoft Common Objects in Context (COCO) | складні побутові сцени звичайних предметів у їх природному контексті. | Виділення, маркування та класифікація об’єктів на 91 тип об’єкта. | 2,500,000 | Марковані зображення, текст | Розпізнавання об'єктів | 2015 | [48][49][50] | T. Lin et al. |
SUN Database | Дуже велика база даних розпізнавання сцен і об'єктів. | Місця та предмети позначаються. Об’єкти сегментовані. | 131,067 | Зображення, текст | Розпізнавання об'єктів, розпізнавання сцени | 2014 | [51][52] | J. Xiao et al. |
ImageNet | Labeled object image database, used in the ImageNet Large Scale Visual Recognition Challenge | Позначені об’єкти, обмежувальні рамки, описові слова, функції SIFT | 14,197,122 | Зображення, текст | Розпізнавання об'єктів, розпізнавання сцени | 2009 (2014) | [53][54][55] | J. Deng et al. |
Open Images | Великий набір зображень із ліцензією CC BY 2.0 з мітками на рівні зображення та обмежуючими рамками, що охоплюють тисячі класів. | Мітки на рівні зображення, обмежувальні рамки | 9,178,275 | Зображення, текст | Класифікація, розпізнавання об'єктів | 2017 | [56] | |
TV News Channel Commercial Detection Dataset | Телевізійна реклама та випуск новин. | Функції аудіо та відео, отримані з фотографій. | 129,685 | Текст | Кластеризація, класифікація | 2015 | [57][58] | P. Guha et al. |
Statlog (Image Segmentation) Dataset | Примірники були відібрані випадковим чином з бази даних із 7 зовнішніх зображень і сегментовані вручну, щоб створити класифікацію для кожного пікселя. | Розраховано багато функцій. | 2310 | Текст | Класифікація | 1990 | [59] | University of Massachusetts |
Caltech 101 | Зображення предметів. | Позначено детальні контури об'єкта. | 9146 | Зображення | Класифікація, розпізнавання об'єктів. | 2003 | [60][61] | F. Li et al. |
Caltech-256 | Великий набір зображень для класифікації об’єктів. | Зображення розбиті на категорії та відсортовані вручну. | 30,607 | Зображення, текст | Класифікація, виявлення об'єктів | 2007 | [62][63] | G. Griffin et al. |
SIFT10M Dataset | Функції SIFT набору даних Caltech-256. | Розширене вилучення функцій SIFT.. | 11,164,866 | Текст | Класифікація, виявлення об'єктів | 2016 | [64] | X. Fu et al. |
LabelMe | Коментовані зображення сцен. | Окреслені об’єкти. | 187,240 | Зображення, текст | Класифікація, виявлення об'єктів | 2005 | [65] | MIT Computer Science and Artificial Intelligence Laboratory |
Cityscapes Dataset | Стерео-відеосекції, записані у вуличних сценах, з анотаціями на рівні пікселів. Метадані також включені. | Сегментація та маркування на рівні пікселів | 25,000 | Зображення, текст | Класифікація, виявлення об'єктів | 2016 | [66] | Daimler AG et al. |
PASCAL VOC Dataset | Велика кількість зображень для завдань класифікації. | Маркування, обмежувальна рамка в комплекті | 500,000 | Зображення, текст | Класифікація, виявлення об'єктів | 2010 | [67][68] | M. Everingham et al. |
CIFAR-10 Dataset | Багато маленьких зображень з низькою роздільною здатністю 10 класів об’єктів. | Класи позначені, створені розділи навчальних наборів. | 60,000 | Зображення | Класифікація | 2009 | [54][69] | A. Krizhevsky et al. |
CIFAR-100 Dataset | Як і CIFAR-10, вище, але надано 100 класів об'єктів. | Класи позначені, створені розділи навчальних наборів. | 60,000 | Зображення | Класифікація | 2009 | [54][69] | A. Krizhevsky et al. |
CINIC-10 Dataset | Єдиний внесок CIFAR-10 і Imagenet з 10 класами і 3 розділами. Більше за CIFAR-10. | Класи позначені, навчання, перевірка, створені розділи тестових наборів. | 270,000 | Зображення | Класифікація | 2018 | [70] | Luke N. Darlow, Elliot J. Crowley, Antreas Antoniou, Amos J. Storkey |
Fashion-MNIST | База даних модних товарів, схожа на MNIST | Класи позначені, створені розділи навчальних наборів. | 60,000 | Зображення | Класифікація | 2017 | [71] | Zalando SE |
notMNIST | Деякі загальнодоступні шрифти та витягнуті з них гліфи, щоб зробити набір даних подібним до MNIST. Існує 10 класів, з літерами A-J, взятими з різних шрифтів.
Deyaki zahalʹnodostupni |
Класи позначені, створені розділи навчальних наборів. | 500,000 | Зображення | Класифікація | 2011 | [72] | Yaroslav Bulatov |
German Traffic Sign Detection Benchmark Dataset | Зображення з транспортних засобів дорожніх знаків на німецьких дорогах. Ці знаки відповідають стандартам ООН і тому такі ж, як і в інших країнах. | Знаки з маркуванням вручну | 900 | Зображення | Класифікація | 2013 | [73][74] | S Houben et al. |
KITTI Vision Benchmark Dataset | Автономні транспортні засоби, що рухалися містом середнього розміру, фіксували зображення різних районів за допомогою камер і лазерних сканерів. | Багато тестів, отриманих з даних. | >100 GB of data | Зображення, текст | Класифікація, виявлення об'єктів | 2012 | [75][76][77] | A Geiger et al. |
Linnaeus 5 dataset | Зображення 5 класів предметів. | Класи позначені, створені розділи навчальних наборів. | 8000 | Зображення | Класифікація | 2017 | [78] | Chaladze & Kalatozishvili |
FieldSAFE | Мультимодальний набір даних для виявлення перешкод у сільському господарстві, включаючи стереокамеру, тепловізійну камеру, веб-камеру, 360-градусну камеру, лідар, радар і точну локалізацію. | Класи, позначені географічно. | >400 GB of data | Зображення та тривимірні хмари точок | Класифікація, виявлення об'єктів, локалізація об'єктів | 2017 | [79] | M. Kragh et al. |
11K Hands | 11 076 зображень рук (1600 x 1200 пікселів) 190 суб’єктів різного віку від 18 до 75 років для розпізнавання статі та біометричної ідентифікації. | Немає | 11,076 hand images | Зображення та файли етикеток (.mat, .txt і .csv). | Розпізнавання статі та біометрична ідентифікація | 2017 | [80] | M Afifi |
CORe50 | Спеціально розроблена для безперервного/довічного навчання та розпізнавання об’єктів, це колекція з понад 500 відео (30 кадрів в секунду) із 50 домашніми об’єктами, які належать до 10 різних категорій. | Позначені класи, розділи навчальних наборів створені на основі 3-х шляхового тесту для кількох запусків. | 164,866 RBG-D images | зображення (.png або .pkl)
та файли етикеток (.pkl, .txt, .tsv). |
Класифікація, розпізнавання об'єктів | 2017 | [81] | V. Lomonaco and D. Maltoni |
THz and thermal video data set | Цей мультиспектральний набір даних включає терагерцові, теплові, візуальні, ближні інфрачервоні та тривимірні відео об’єктів, прихованих під одягом людей. | Надаються таблиці 3D пошуку, які дозволяють проектувати зображення на тривимірні хмари точок. | More than 20 videos. The duration of each video is about 85 seconds (about 345 frames). | AP2J | Експерименти з виявленням прихованих об'єктів | 2019 | [82][83] | Alexei A. Morozov and Olga S. Sushkova |
Почерк і розпізнавання символів
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Artificial Characters Dataset | Штучно згенеровані дані, що описують структуру 10 великих англійських літер. | Координати намальованих ліній задані як цілі числа. Різні інші особливості. | 6000 | Текст | Розпізнавання рукописного тексту, класифікація | 1992 | [84] | H. Guvenir et al. |
Letter Dataset | Верхні друковані літери. | З усіх зображень витягується 17 функцій. | 20,000 | Текст | OCR, класифікація | 1991 | [85][86] | D. Slate et al. |
CASIA-HWDB | База даних рукописних китайських символів офлайн. 3755 класів у наборі символів GB 2312. | Зображення в сірому кольорі з фоновими пікселями, позначені як 255. | 1,172,907 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 2009 | [87] | CASIA |
CASIA-OLHWDB | База даних рукописних китайських ієрогліфів онлайн, зібрана за допомогою ручки Anoto на папері. 3755 класів у наборі символів GB 2312. | Надає послідовності координат штрихів. | 1,174,364 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 2009 | [88][89] | CASIA |
Character Trajectories Dataset | Марковані зразки траєкторій кінчика пера для людей, які пишуть прості символи. | 3-dimensional pen tip velocity trajectory matrix for each sample | 2858 | Текст | Розпізнавання рукописного тексту, класифікація | 2008 | [90][91] | B. Williams |
Chars74K Dataset | Розпізнавання символів у природних зображеннях символів, які використовуються як англійською, так і каннадською | Тривимірна матриця траєкторій швидкості кінчика пера для кожного зразка | 74,107 | Розпізнавання символів, розпізнавання рукописного тексту, OCR, класифікація | 2009 | [92] | T. de Campos | |
EMNIST dataset | Рукописні символи від 3600 авторів | Похідне від спеціальної бази даних NIST 19. Перетворено на зображення розміром 28x28 пікселів, що відповідають набору даних MNIST. | 800,000 | Зображення | розпізнавання символів, класифікація, розпізнавання почерку | 2016 | EMNIST dataset[93]
Documentation[94] |
Gregory Cohen, et al |
UJI Pen Characters Dataset | Ізольовані рукописні символи | Дано координати положення пера як символи. | 11,640 | Текст | Розпізнавання рукописного тексту, класифікація | 2009 | [95][96] | F. Prat et al. |
Gisette Dataset | Зразки почерку з 4 і 9 символів, які часто плутають. | Функції, витягнуті з зображень, розділені на train/test, розмір зображень рукописного введення нормалізовано. | 13,500 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 2003 | [97] | Yann LeCun et al. |
Omniglot dataset | 1623 різних рукописних символи з 50 різних алфавітів. | Марковані вручну. | 38,300 | Зображення,
текст |
Класифікація, одноразове навчання | 2015 | [98][99] | American Association for the Advancement of Science |
MNIST database | База даних рукописних цифр. | Марковані вручну. | 60,000 | Зображення,
текст |
Класифікація | 1998 | [100][101] | National Institute of Standards and Technology |
Optical Recognition of Handwritten Digits Dataset | Нормовані растрові зображення рукописних даних. | Розмір нормалізовано та зіставлено на растрові зображення. | 5620 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 1998 | [102] | E. Alpaydin et al. |
Pen-Based Recognition of Handwritten Digits Dataset | Рукописні цифри на електронній ручці-планшеті. | Витягуються вектори ознак для рівномірного розміщення. | 10,992 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 1998 | [103][104] | E. Alpaydin et al. |
Semeion Handwritten Digit Dataset | Рукописні цифри від 80 осіб. | Усі рукописні цифри нормалізовано за розміром і відображено в одній сітці. | 1593 | Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 2008 | [105] | T. Srl |
HASYv2 | Рукописні математичні символи | Усі символи відцентровані та мають розмір 32px x 32px. | 168233 | Зображення,
текст |
Класифікація | 2017 | [106] | Martin Thoma |
Noisy Handwritten Bangla Dataset | Включає набір даних рукописних цифр (10 класів) і базовий набір даних символів (50 класів), кожен набір даних має три типи шуму: білий гаусів, розмиття в русі та знижену контрастність. | Усі зображення відцентровані та мають розмір 32x32. | Numeral Dataset:
23330, Character Dataset: 76000 |
Зображення,
текст |
Розпізнавання рукописного тексту, класифікація | 2017 | [107][108] | M. Karki et al. |
Аерофотознімки
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
iSAID: Instance Segmentation in Aerial Images Dataset | Точна анотація на рівні екземпляра, виконана професійними анотаторами, перевірена та підтверджена експертними анотаторами, які відповідають чітко визначеним інструкціям. | 655,451 (15 classes) | Зображення, jpg, json | Повітряна класифікація, виявлення об'єктів, сегментація екземплярів | 2019 | [109] | Syed Waqas Zamir,
Aditya Arora, Akshita Gupta, Salman Khan, Guolei Sun, Fahad Shahbaz Khan, Fan Zhu, Ling Shao, Gui-Song Xia, Xiang Bai | |
Aerial Image Segmentation Dataset | 80 аерофотознімків високої роздільної здатності з просторовою роздільною здатністю від 0,3 до 1,0. | Зображення сегментовані вручну. | 80 | Зображення | Повітряна класифікація, виявлення об'єктів | 2013 | [110][111] | J. Yuan et al. |
KIT AIS Data Set | Кілька позначених наборів навчальних та оцінювальних даних аерофотознімків натовпу. | Зображення, позначені вручну, щоб показувати шляхи людей через натовп | ~ 150 | Зображення з доріжками | Відстеження людей, повітряне спостереження | 2012 | [112][113] | M. Butenuth et al. |
Wilt Dataset | Дані дистанційного зондування хворих дерев та іншого ґрунтового покриву. | Вилучено різні функції. | 4899 | Зображення | Класифікація, виявлення повітряних об'єктів | 2014 | [114][115] | B. Johnson |
MASATI dataset | Морські сцени оптичних аерофотознімків із видимого спектру. Він містить кольорові зображення в динамічних морських середовищах, кожне зображення може містити одну або кілька цілей за різних погодних умов і умов освітлення. | Обмежувальні рамки та маркування об’єктів. | 7389 | Зображення | Класифікація, виявлення повітряних об'єктів | 2018 | [116][117] | A.-J. Gallego et al. |
Forest Type Mapping Dataset | Супутникові зображення лісів Японії. | Вилучено діапазони довжин хвилі зображення. | 326 | Текст | Класифікація | 2015 | [118][119] | B. Johnson |
Overhead Imagery Research Data Set | Коментовані зображення накладних. Зображення з кількома об'єктами. | Понад 30 анотацій і понад 60 статистичних даних, які описують ціль у контексті зображення. | 1000 | Зображення, текст | Класифікація | 2009 | [120][121] | F. Tanner et al. |
SpaceNet | SpaceNet — це сукупність комерційних супутникових зображень і позначених навчальних даних. | Файли GeoTiff і GeoJSON, що містять сліди будівлі. | >17533 | Зображення | Класифікація, ідентифікація об'єкта | 2017 | [122][123] | DigitalGlobe, Inc. |
UC Merced Land Use Dataset | Ці зображення були вручну витягнуті з великих зображень із колекції зображень міських районів Національної карти USGS для різних міських районів США. | Це 21-класний набір зображень землекористування, призначений для дослідницьких цілей. Для кожного класу є 100 зображень. | 2,100 | Зображення фішки розміром 256x256, 30 см (1 фут) GSD | Класифікація земельного покриву | 2010 | Yi Yang and Shawn Newsam | |
SAT-4 Airborne Dataset | Зображення було витягнуто з набору даних Національної програми зображення сільського господарства (NAIP). | SAT-4 має чотири широкі класи ґрунтового покриву, включає безплідні землі, дерева, пасовища та клас, який складається з усіх класів ґрунтового покриву, крім трьох вищезазначених. | 500,000 | Зображення | Класифікація | 2015 | [124][125] | S. Basu et al. |
SAT-6 Airborne Dataset | Зображення було витягнуто з набору даних Національної програми зображення сільського господарства (NAIP). | SAT-6 має шість широких класів ґрунтового покриву, включає безплідні землі, дерева, пасовища, дороги, будівлі та водойми. | 405,000 | Зображення | Класифікація | 2015 | [126][127] | S. Basu et al. |
Інші зображення
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
NRC-GAMMA | Новий еталонний набір зображень газового лічильника | Жодного | 28,883 | Зображення, етикетка | Класифікація | 2021 | [128][129] | A. Ebadi, P. Paul, S. Auer, & S. Tremblay |
The SUPATLANTIQUE dataset | Зображення відсканованих офіційних документів та документів Вікіпедії | Жодного | 4908 | TIFF/pdf | Ідентифікація вихідного пристрою, виявлення підробок, класифікація,... | 2020 | [130][131] | C. Ben Rabah et al. |
Density functional theory quantum simulations of graphene | Позначені зображення вихідних даних для моделювання графену | Необроблені дані (у форматі HDF5) і вихідні мітки з квантового моделювання теорії функціональної щільності | 60744 тестових і 501473 навчальних файлів | Марковані зображення | Регресія | 2019 | [132] | K. Mills & I. Tamblyn |
Quantum simulations of an electron in a two dimensional potential well | Позначені зображення вихідних даних для моделювання 2d квантової механіки | Необроблені дані (у форматі HDF5) та вихідні мітки з квантового моделювання | 1,3 мільйона зображень | Марковані зображення | Регресія | 2017 | [133] | K. Mills, M.A. Spanner, & I. Tamblyn |
MPII Cooking Activities Dataset | Відео та зображення різних кулінарних заходів. | Шляхи та напрямки діяльності, мітки, дрібнозернисте позначення руху, клас активності, вилучення та маркування нерухомих зображень. | 881,755 frames | Марковані відео, зображення, текст | Класифікація | 2012 | [134][135] | M. Rohrbach et al. |
FAMOS Dataset | 5000 унікальних мікроструктур, всі зразки були отримані 3 рази за допомогою двох різних камер. | Оригінальні файли PNG, відсортовані за камерою, а потім за придбанням. Файли даних MATLAB з однією матрицею 16384 разів 5000 на камеру на одержання. | 30,000 | Файли зображень і .mat | Аутентифікація | 2012 | [136] | S. Voloshynovskiy, et al. |
PharmaPack Dataset | 1000 унікальних класів з 54 зображеннями в класі. | Маркування класів, багато локальних дескрипторів, таких як SIFT і aKaZE, і локальні агреатори функцій, як-от Fisher Vector (FV). | 54,000 | Файли зображень і .mat | Дрібнозерниста класифікація | 2017 | [137] | O. Taran and S. Rezaeifar, et al. |
Stanford Dogs Dataset | Зображення 120 порід собак з усього світу. | Надаються розділи для навчання/тесту та анотації ImageNet. | 20,580 | Зображення, текст | Дрібнозерниста класифікація | 2011 | [138][139] | A. Khosla et al. |
StanfordExtra Dataset | 2D ключові точки та сегментації для набору даних Stanford Dogs. | Надано 2D ключові точки та сегментації. | 12,035 | Марковані зображення | 3D реконструкція/оцінка пози | 2020 | [140] | B. Biggs et al. |
The Oxford-IIIT Pet Dataset | 37 категорій домашніх тварин із приблизно 200 зображеннями кожної. | Мітка породи, щільна рамка, сегментація переднього плану та фону. | ~ 7,400 | Зображення, текст | Класифікація, виявлення об'єктів | 2012 | [141][142] | O. Parkhi et al. |
Corel Image Features Data Set | База даних зображень з витягнутими функціями. | Багато функцій, включаючи гістограму кольорів, текстуру спільного появи та колірні моменти, | 68,040 | Текст | Класифікація, виявлення об'єктів | 1999 | [143][144] | M. Ortega-Bindenberger et al. |
Online Video Characteristics and Transcoding Time Dataset. | Час перекодування для різних відео та властивостей відео. | Надано функції відео. | 168,286 | Текст | Регресія | 2015 | [145] | T. Deneke et al. |
Microsoft Sequential Image Narrative Dataset (SIND) | Набір даних для послідовного перегляду мови | Описові підписи та розповідь наведено для кожної фотографії, а фотографії розташовані в послідовності | 81,743 | Зображення, текст | Візуальне оповідання | 2016 | [146] | Microsoft Research |
Caltech-UCSD Birds-200-2011 Dataset | Великий набір зображень птахів. | Розташування частин для птахів, рамки, 312 бінарних атрибутів | 11,788 | Зображення ,текст | Класифікація | 2011 | [147][148] | C. Wah et al. |
YouTube-8M | Великий і різноманітний набір відеоданих із мітками | Ідентифікатори відео YouTube і пов’язані мітки з різноманітного словника з 4800 візуальних об’єктів | 8 million | Відео, текст | Класифікація відео | 2016 | [149][150] | S. Abu-El-Haija et al. |
YFCC100M | Великий і різноманітний набір даних зображень і відео з мітками | Розташування частин для птахів, обмежувальні рамки, 312 бінарних атрибутів, надані Flickr Videos and Images та пов’язані описи, назви, теги та інші метадані (наприклад, EXIF та геотеги) | 100 million | Відео, зображення,текст | Класифікація відео та зображень | 2016 | [151][152] | B. Thomee et al. |
Discrete LIRIS-ACCEDE | Короткі відео з анотаціями для валентності та збудження. | Етикетки валентності та збудження. | 9800 | Відео | Відео виявлення емоцій | 2015 | [153] | Y. Baveye et al. |
Continuous LIRIS-ACCEDE | Довгі відео з анотаціями для валентності та збудження, а також зібрані гальванічні реакції шкіри. | Етикетки валентності та збудження. | 30 | Відео | Відео виявлення емоцій | 2015 | [154] | Y. Baveye et al. |
MediaEval LIRIS-ACCEDE | Розширення Discrete LIRIS-ACCEDE, включаючи анотації для рівнів насильства у фільмах. | Мітки насильства, валентності та збудження. | 10900 | Відео | Відео виявлення емоцій | 2015 | [155] | Y. Baveye et al. |
Leeds Sports Pose | Артикуловані анотації людської пози на 2000 природних спортивних зображеннях із Flickr. | Грубий урожай навколо однієї особи, яка цікавить, з 14 спільними етикетками | 2000 | Зображення плюс мітки файлів .mat | Оцінка пози людини | 2010 | [156] | S. Johnson and M. Everingham |
Leeds Sports Pose Extended Training | Чітко сформульовані анотації людської пози на 10 000 природних спортивних зображень із Flickr. | 14 спільних етикеток через краудсорсинг | 10000 | Зображення плюс мітки файлів .mat | Оцінка пози людини | 2011 | [157] | S. Johnson and M. Everingham |
MCQ Dataset | 6 різних реальних іспитів із множинним вибором (735 бланків відповідей і 33 540 блоків відповідей) для оцінки методів і систем комп’ютерного зору, розроблених для систем оцінювання тестів із множинним вибором. | Жодного | 735 бланків відповідей та 33 540 скриньок для відповідей | Мітки файлів зображень і .mat | Розробка систем оцінювання тестів із множинним вибором | 2017 | [158][159] | Afifi, M. et al. |
Surveillance Videos | Справжні відеоспостереження охоплюють великий час спостереження (7 днів по 24 години кожне). | Жодного | 19 surveillance videos (7 days with 24 hours each). | Відео | Стиснення даних | 2016 | [160] | Taj-Eddin, I. A. T. F. et al. |
LILA BC | Маркована інформаційна бібліотека Олександрії: біологія та охорона. Позначені зображення, які підтримують дослідження машинного навчання в галузі екології та екології. | Жодного | ~10M images | Зображення | Класифікація | 2019 | [161] | LILA working group |
Can We See Photosynthesis? | 32 відео для восьми живих і восьми мертвих листків, записаних в умовах освітлення постійного та змінного струму. | Жодного | 32 відео | Відео | Виявлення живості рослин | 2017 | [162] | Taj-Eddin, I. A. T. F. et al. |
Mathematical Mathematics Memes | Колекція з 10 000 мемів з математики. | Жодного | ~10,000 | Зображення | Візуальне оповідання, виявлення об’єктів. | 2021 | [163] | Mathematical Mathematics Memes |
Текстові дані
Ці набори даних складаються переважно з тексту для таких завдань, як обробка мови, аналіз настроїв, переклад і кластерний аналіз.
Відгуки
Назва | Опис | Оброботка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Amazon reviews | Огляди американських продуктів від Amazon.com. | Жодного | 233.1 million | Текст | Класифікація, аналіз настроїв | 2015 (2018) | [164][165] | McAuley et al. |
OpinRank Review Dataset | Огляди автомобілів і готелів від Edmunds.com і TripAdvisor відповідно. | Жодного | 42,230 / ~259,000 respectively | Текст | Аналіз настроїв, кластеризація | 2011 | [166][167] | K. Ganesan et al. |
MovieLens | 22 000 000 оцінок і 580 000 тегів застосовано до 33 000 фільмів 240 000 користувачів. | Жодного | ~ 22M | Текст | Регресія, кластеризація, класифікація | 2016 | [168] | GroupLens Research |
Yahoo! Music User Ratings of Musical Artists | Понад 10 мільйонів рейтингів виконавців від користувачів Yahoo. | Жодного не описано. | ~ 10M | Текст | Класифікація, регресія | 2004 | [169][170] | Yahoo! |
Car Evaluation Data Set | Властивості автомобіля та їх загальна прийнятність. | Наведено шість категоріальних ознак. | 1728 | Текст | Класифікація | 1997 | [171] | M. Bohanec |
YouTube Comedy Slam Preference Dataset | Дані про голосування користувачів для пар відео, які відображаються на YouTube. Користувачі голосували за смішніші відео. | Надано метадані відео. | 1,138,562 | Текст | Класифікація | 2012 | [172][173] | |
Skytrax User Reviews Dataset | Відгуки користувачів про авіакомпанії, аеропорти, місця та салони від Skytrax. | Оцінки є дрібними і включають багато аспектів досвіду в аеропорту. | 41396 | Текст | Класифікація, регресія | 2015 | [174] | Q. Nguyen |
Teaching Assistant Evaluation Dataset | Огляди помічника вчителя. | Наведено особливості кожного екземпляра, такі як клас, розмір класу та викладач. | 151 | Текст | Класифікація | 1997 | [175] | W. Loh et al. |
Vietnamese Students’ Feedback Corpus (UIT-VSFC) | Відгуки студентів. | Коментарі | 16,000 | Текст | Класифікація | 1997 | Nguyen et al. | |
Vietnamese Social Media Emotion Corpus (UIT-VSMEC) | Коментарі користувачів у Facebook. | Коментарі | 6,927 | Текст | Класифікація | 1997 | Nguyen et al. | |
Vietnamese Open-domain Complaint Detection dataset (ViOCD) | Коментарі користувачів у Facebook. | Коментарі | 5,485 | Текст | Класифікація | 2021 | Nguyen et al. |
Новини
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
NYSK Dataset | Англійські новини про справу щодо звинувачень у сексуальному насильстві проти колишнього директора МВФ Домініка Стросс-Кана. | Відфільтровано та представлено у форматі XML. | 10,421 | XML, текст | Аналіз настроїв, виділення теми | 2013 | Dermouche, M. et al. | |
The Reuters Corpus Volume 1 | Великий корпус новин Reuters англійською мовою. | Дрібнозерниста категоризація та коди тем. | 810,000 | Текст | Класифікація, кластеризація, узагальнення | 2002 | Reuters | |
The Reuters Corpus Volume 2 | Великий корпус новин Reuters кількома мовами. | Дрібнозерниста категоризація та коди тем. | 487,000 | Текст | Класифікація, кластеризація, узагальнення | 2005 | Reuters | |
Thomson Reuters Text Research Collection | Великий корпус новин. | Деталі не описані. | 1,800,370 | Текст | Класифікація, кластеризація, узагальнення | 2009 | T. Rose et al. | |
Saudi Newspapers Corpus | 31 030 арабських газетних статей. | Вилучено метадані. | 31,030 | JSON | Підведення підсумків, кластеризація | 2015 | M. Alhagri | |
RE3D (Relationship and Entity Extraction Evaluation Dataset) | Entity and Relation позначені дані з різних новин та державних джерел. За підтримки Dstl | Відфільтровано, категоризація за допомогою типів Baleen | невідомо | JSON | Класифікація, сутність і розпізнавання відносин | 2017 | Dstl | |
Examiner Spam Clickbait Catalogue | Приманки кліків, спам, заголовки з краудсорсингу з 2010 по 2015 рік | Опублікувати дату та заголовки | 3,089,781 | CSV | Кластеризація, події, настрої | 2016 | R. Kulkarni | |
ABC Australia News Corpus | Весь корпус новин ABC Australia з 2003 по 2019 рік | Опублікувати дату та заголовки | 1,186,018 | CSV | Кластеризація, події, настрої | 2020 | R. Kulkarni | |
Worldwide News – Aggregate of 20K Feeds | Тижневий знімок усіх онлайн-заголовків понад 20 мовами | Час публікації, URL-адреса та заголовки | 1,398,431 | CSV | Кластеризація, події, визначення мови | 2018 | R. Kulkarni | |
Reuters News Wire Headline | 11 років подій із мітками часу, опублікованих у новинах | Час публікації, текст заголовка | 16,121,310 | CSV | НЛП, Комп'ютерна лінгвістика, Події | 2018 | R. Kulkarni | |
The Irish Times Ireland News Corpus | Новини 24 років Ірландії з 1996 по 2019 рік | Час публікації, категорія заголовка та текст | 1,484,340 | CSV | НЛП, Комп'ютерна лінгвістика, Події | 2020 | R. Kulkarni | |
News Headlines Dataset for Sarcasm Detection | Високоякісний набір даних із саркастичними та несаркастичними заголовками новин. | Чистий, нормований текст | 26,709 | JSON | НЛП, Комп'ютерна лінгвістика | 2018 | Rishabh Misra |
Повідомлення
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Enron Email Dataset | Електронні листи від співробітників Enron розбиті в папки. | Вкладення видалено, недійсні адреси електронної пошти перетворені на user@enron.com або no_address@enron.com | ~ 500,000 | Текст | Аналіз мережі, аналіз настроїв | 2004 (2015) | Klimt, B. and Y. Yang | |
Ling-Spam Dataset | Корпус, що містить як легітимні листи, так і спам. | Чотири версії корпусу щодо того, чи був увімкнений лемматизатор чи стоп-лист. | 2,412 Ham 481 Spam | Текст | Класифікація | 2000 | Androutsopoulos, J. et al. | |
SMS Spam Collection Dataset | Зібрані SMS-повідомлення зі спамом. | Немає | 5,574 | Текст | Класифікація | 2011 | T. Almeida et al. | |
Messages from 20 different newsgroups. | Повідомлення з 20 різних груп новин. | Немає | 20,000 | Текст | Обробка природної мови | 1999 | T. Mitchell et al. | |
Spambase Dataset | Спам електронних листів. | Вилучено багато текстових функцій. | 4,601 | Текст | Виявлення спаму, класифікація | 1999 | M. Hopkins et al. |
Твіттер і твіти
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
MovieTweetings | Набір даних рейтингу фільмів на основі загальнодоступних і добре структурованих твітів | ~710,000 | Текст | Класифікація, регресія | 2018 | S. Dooms | ||
Twitter100k | Пари зображень і твітів | 100,000 | Текст і зображення | Міжмедійний пошук | 2017 | Y. Hu, et al. | ||
Sentiment140 | Дані твітів за 2009 рік, включаючи оригінальний текст, мітку часу, користувача та настрої. | Класифіковано за допомогою дистанційного спостереження від наявності смайлика в твіті. | 1,578,627 | Твіти, коми, розділені значення | аналіз настроїв | 2009 | A. Go et al. | |
ASU Twitter Dataset | Дані мережі Twitter, а не фактичні твіти. Показує зв’язки між великою кількістю користувачів. | Немає | 11 316 811 користувачів, 85 331 846 підключень | Текст | Кластеризація, аналіз графів | 2009 | R. Zafarani et al. | |
SNAP Social Circles: Twitter Database | Великі дані мережі Twitter. | Характеристики вузлів, кола та мережі его. | 1,768,149 | Текст | Кластеризація, аналіз графів | 2012 | J. McAuley et al. | |
Twitter Dataset for Arabic Sentiment Analysis | Арабські твіти. | Зразки, позначені вручну як позитивні чи негативні. | 2000 | Текст | Класифікація | 2014 | N. Abdulla | |
Buzz in Social Media Dataset | Дані з Twitter і Tom's Hardware. Цей набір даних зосереджено на конкретних актуальних темах, які обговорюються на цих сайтах. | Дані відображаються у вікні, щоб користувач міг спробувати передбачити події, які призвели до шуму в соціальних мережах. | 140,000 | Текст | Регресія, класифікація | 2013 | F. Kawala et al. | |
Paraphrase and Semantic Similarity in Twitter (PIT) | Цей набір даних зосереджується на тому, чи мають твіти (майже) однакове значення/інформацію чи ні. Маркування вручну. | токенізацію, тегування частин мови та іменованих об’єктів | 18,762 | Текст | Регресія, класифікація | 2015 | Xu et al. | |
Geoparse Twitter benchmark dataset | Цей набір даних містить твіти під час різних новинних подій у різних країнах. Згадки про місцеположення, позначені вручну. | до метаданих JSON додано анотації про місцезнаходження | 6,386 | Tweets, JSON | Класифікація, вилучення інформації | 2014 | S.E. Middleton et al. | |
Dutch Social media collection | Цей набір даних містить твіти про COVID-19, зроблені нідерландськими носіями або користувачами з Нідерландів. Дані були позначені машиною | класифіковано за настрої, текст твітів і опис користувача, перекладений англійською. Вилучаються згадки про галузь | 271,342 | JSONL | Настрої, класифікація з кількома мітками, машинний переклад | 2020 | Aaaksh Gupta, CoronaWhy |
Діалоги
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
NPS Chat Corpus | Публікації з вікових онлайн-чатів. | Конфіденційність рук замаскована, позначена як частина мови та діалог-акт. | ~ 500,000 | XML | НЛП, програмування, лінгвістика | 2007 | Forsyth, E., Lin, J., & Martell, C. | |
Twitter Triple Corpus | A-B-A трійки витягнуто з Twitter. | 4,232 | Текст | NLP | 2016 | Sordini, A. et al. | ||
UseNet Corpus | Повідомлення на форумі UseNet. | Анонімні електронні листи та URL-адреси. Пропущені документи довжиною <500 слів або >500 000 слів, або які були <90% англійською. | 7 billion | Текст | 2011 | Shaoul, C., & Westbury C. | ||
NUS SMS Corpus | SMS-повідомлення, зібрані між двома користувачами, з аналізом часу. | ~ 10,000 | XML | NLP | 2011 | KAN, M | ||
Reddit All Comments Corpus | Усі коментарі на Reddit (станом на 2015 рік). | ~ 1.7 billion | JSON | НЛП, дослідження | 2015 | Stuck_In_the_Matrix | ||
Ubuntu Dialogue Corpus | Діалоги, витягнуті з потоку чату Ubuntu на IRC. | 930 thousand dialogues, 7.1 million utterances | CSV | Dialogue Systems Research | 2015 | Lowe, R. et al. | ||
Dialog State Tracking Challenge | Проблеми відстеження стану діалогу 2 і 3 (DSTC2&3) були дослідницьким завданням, зосередженим на покращенні сучасного рівня відстеження стану мовних діалогових систем. | Транскрипція розмовних діалогів з маркуванням | DSTC2 contains ~3.2k calls – DSTC3 contains ~2.3k calls | Json | Відстеження стану діалогу | 2014 | Henderson, Matthew and Thomson, Blaise and Williams, Jason D |
Інший текст
Назва | Опис | Обробка | Розмір | Формат | Формат | Створений | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Web of Science Dataset | Ієрархічні набори даних для класифікації тексту | Немає | 46,985 | Текст | класифікація,
Категоризація |
2017 | K. Kowsari et al. | |
Legal Case Reports | Розгляд справ Федерального суду Австралії з 2006 по 2009 роки. | Немає | 4,000 | Текст | Підведення підсумків,
аналіз цитування |
2012 | F. Galgani et al. | |
Blogger Authorship Corpus | Записи в блозі 19 320 людей із blogger.com. | Блогер сам надає стать, вік, галузь та астрологічний знак. | 681,288 | Текст | Аналіз настроїв, узагальнення, класифікація | 2006 | J. Schler et al. | |
Social Structure of Facebook Networks | Великий набір даних соціальної структури Facebook. | Немає | Охоплено 100 коледжів | Текст | Аналіз мережі, кластеризація | 2012 | A. Traud et al. | |
Dataset for the Machine Comprehension of Text | Розповіді та відповідні запитання для перевірки розуміння тексту. | Немає | 660 | Текст | Обробка природної мови, машинне розуміння | 2013 | M. Richardson et al. | |
The Penn Treebank Project | Природний текст, анотований для мовної структури. | Текст розбирається на семантичні дерева. | ~ 1 млн слів | Текст | Обробка природної мови, узагальнення | 1995 | M. Marcus et al. | |
DEXTER Dataset | Поставлене завдання – визначити за наведеними ознаками, які статті стосуються корпоративних придбань. | Вилучені ознаки включають основи слів. Включені функції відволікача. | 2600 | Текст | Класифікація | 2008 | Reuters | |
Google Books N-grams | N-грами з дуже великого корпусу книг | Немає | 2,2 ТБ тексту | Текст | Класифікація, кластеризація, регресія | 2011 | ||
Personae Corpus | Зібрано для експериментів із визначення авторства та передбачення особистості. Складається з 145 есе голландською мовою. | Крім звичайних текстів наводяться синтаксично анотовані тексти. | 145 | Текст | Класифікація, регресія | 2008 | K. Luyckx et al. | |
CNAE-9 Dataset | Завдання на категоризацію для вільних текстових описів бразильських компаній. | Вилучено частоту слів. | 1080 | Текст | Класифікація | 2012 | P. Ciarelli et al. | |
Sentiment Labeled Sentences Dataset | 3000 речень, позначених настроєм | Настрої кожного речення вручну позначені як позитивні чи негативні. | 3000 | Текст | Класифікація, аналіз настроїв | 2015 | D. Kotzias | |
BlogFeedback Dataset | Набір даних для прогнозування кількості коментарів, які отримає публікація на основі функцій цієї публікації. | Вилучено багато функцій кожного повідомлення. | 60,021 | Текст | Регресія | 2014 | K. Buza | |
Stanford Natural Language Inference (SNLI) Corpus | Підписи до зображень поєднуються з нещодавно створеними реченнями, щоб утворити суть, протиріччя або нейтральні пари. | Мітки класів Entailment, синтаксичний аналіз за допомогою аналізатора Stanford PCFG | 570,000 | Текст | Висновок природної мови/розпізнавання тексту | 2015 | S. Bowman et al. | |
DSL Corpus Collection (DSLCC) | Багатомовна збірка коротких уривків публіцистичних текстів схожими мовами та діалектами. | Немає | 294,000 фраз | Текст | Розрізнення схожих мов | 2017 | Tan, Liling et al. | |
Urban Dictionary Dataset | Корпус слів, голосів і визначень | Імена користувачів анонімні | 2,580,925 | CSV | НЛП, машинне розуміння | 2016 May | Anonymous | |
T-REx | Реферати Вікіпедії узгоджені з сутностями Вікіданих | Вирівнювання трійок Вікіданих з тезами Вікіпедії | 11M вирівняні трійки | JSON and NIF [3] | НЛП, вилучення відносин | 2018 | H. Elsahar et al. | |
General Language Understanding Evaluation (GLUE) | Тест із дев’яти завдань | Різні | ~1М речень і пар речень | NLU | 2018 | Wang et al. | ||
Contract Understanding Atticus Dataset (CUAD) (formerly known as Atticus Open Contract Dataset (AOK)) | Набір даних юридичних договорів з багатими експертними анотаціями | ~13 000 етикеток | CSV and PDF | Обробка природної мови, QnA | 2021 | The Atticus Project | ||
Vietnamese Image Captioning Dataset (UIT-ViIC) | В'єтнамський набір даних підписів зображень | 19 250 підписів для 3 850 зображень | CSV and PDF | Обробка природної мови, комп’ютерний зір | 2020 | Lam et al. | ||
Vietnamese Names annotated with Genders (UIT-ViNames) | В’єтнамські назви з анотаціями статей | 26 850 в’єтнамських повних імен із анотацією статі | CSV | Обробка природної мови | 2020 | To et al. | ||
Vietnamese Constructive and Toxic Speech Detection Dataset (UIT-ViCTSD) | В'єтнамський набір даних для виявлення конструктивної та токсичної мови | 10 000 в'єтнамських користувачів прокоментували інтернет-газети в 10 доменах | CSV | Обробка природної мовиОбробка природної мови | 2021 | Nguyen et al. | ||
The Pile | Збірка кількох великих наборів даних із різноманітних і неструктурованих текстів | Різні (видалення HTML і Javascript з веб-сайтів, видалення повторюваних речень) | 825 ГіБ англійським текстом | JSON Lines | Обробка природної мови, передбачення тексту | 2021 | Gao et |
Звукові дані
Ці набори даних складаються зі звуків і звукових функцій, які використовуються для таких завдань, як розпізнавання мовлення та синтез мовлення.
Мовлення
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Zero Resource Speech Challenge 2015 | Спонтанне мовлення (англійська мова), Читана мова (Xitsonga). | Немає, необроблені файли WAV. | англійська: 5 год, 12 динаміків; Xitsonga: 2:30, 24 динаміки | WAV (audio only) | Неконтрольоване виявлення мовних властивостей/підрядних одиниць/одиниць слів | 2015 | Versteegh et al. | |
Parkinson Speech Dataset | Багато записів людей із хворобою Паркінсона та без неї. | Вилучено голосові характеристики, оцінка захворювання лікарем за уніфікованою шкалою оцінки хвороби Паркінсона. | 1,040 | Текст | Класифікація, регресія | 2013 | B. E. Sakar et al. | |
Spoken Arabic Digits | Розмовні арабські цифри з 44 чоловіків і 44 жінок. | Часові ряди коефіцієнтів мел-частотного кепстру. | 8,800 | Текст | Класифікація | 2010 | M. Bedda et al. | |
ISOLET Dataset | Назви розмовних букв. | Особливості, витягнуті зі звуків. | 7797 | Текст | Класифікація | 1994 | R. Cole et al. | |
Japanese Vowels Dataset | Дев'ять чоловіків, які говорять, вимовляли дві японські голосні підряд. | Застосував до нього 12-градусний аналіз лінійного прогнозування, щоб отримати дискретно-часовий ряд з 12 коефіцієнтами кепстру. | 640 | Текст | Класифікація | 1999 | M. Kudo et al. | |
Parkinson's Telemonitoring Dataset | Багато записів людей із хворобою Паркінсона та без неї. | Вилучено звукові характеристики. | 5875 | Текст | Класифікація | 2009 | A. Tsanas et al. | |
TIMIT | Записи 630 носіїв восьми основних діалектів американської англійської, кожен з яких читає десять фонетично насичених речень. | Мовлення лексично і фонематично транскрибується. | 6300 | Текст | Розпізнавання мовлення, класифікація. | 1986 | J. Garofolo et al. | |
Arabic Speech Corpus | Корпус мовлення сучасної стандартної арабської мови (MSA) для одного мовця з фонетичними та орфографічними транскриптами, вирівняними на рівні фонем. | Мовлення орфографічно і фонетично транскрибується з наголосами. | ~1900 | Текст, WAV | Синтез мовлення, розпізнавання мовлення, вирівнювання корпусу, логопедія, освіта. | 2016 | N. Halabi | |
Common Voice | Загальнодоступна база даних краудсорсингу в широкому діапазоні діалектів. | Перевірка іншими користувачами. | English: 1,118 hours | MP3 з відповідними текстовими файлами | Розпізнавання мови | June 2017 (December 2019) | Mozilla | |
LJSpeech | Корпус англійських записів аудіокниг, які є загальнодоступними, розбитими на короткі кліпи за розділовими знаками. | Перевірка якості, нормалізована транскрипція поряд з оригіналом. | 13,100 | CSV, WAV | Синтез мовлення | 2017 | Keith Ito, Linda Johnson |
Музика
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Geographic Origin of Music Data Set | Звукові особливості музичних зразків з різних місць. | Функції аудіо, отримані за допомогою програмного забезпечення MARSYAS. | 1,059 | Текст | Географічна класифікація, кластеризація | 2014 | F. Zhou et al. | |
Million Song Dataset | Звукові функції з мільйона різних пісень. | Функції аудіо вилучено. | 1M | Текст | Класифікація, кластеризація | 2011 | T. Bertin-Mahieux et al. | |
MUSDB18 | Багатодоріжкові записи популярної музики | Сирий звук | 150 | MP4, WAV | Поділ джерел | 2017 | Z. Rafii et al. | |
Free Music Archive | Аудіо під Creative Commons із 100 тисяч пісень (343 дні, 1TiB) з ієрархією із 161 жанру, метаданими, даними користувача, текстом у довільній формі. | Функції необробленого звуку та аудіо. | 106,574 | Текст , MP3 | Класифікація, рекомендація | 2017 | M. Defferrard et al. | |
Bach Choral Harmony Dataset | Хоральні акорди Баха. | Функції аудіо вилучено. | 5665 | Текст | Класифікація | 2014 | D. Radicioni et al. |
Інші звуки. Класифікація
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
UrbanSound | Марковані звукозаписи звуків, таких як кондиціонери, автомобільні гудки та діти, які грають. | Відсортовано по папках за класом подій, а також метаданими у файлі JSON та анотаціями у файлі CSV. | 1,059 | Звук
(WAV) |
Класифікація | 2014 | J. Salamon et al. | |
AudioSet | 10-секундні звукові фрагменти з відео YouTube та онтологія з понад 500 міток. | 128-d PCA'd VGG-ish показує кожні 1 секунду. | 2,084,320 | Текстові (CSV) і файли TensorFlow Record | Класифікація | 2017 | J. Gemmeke et al., Google | |
Bird Audio Detection challenge | Аудіо зі станцій моніторингу навколишнього середовища, а також записи з краудсорсингу | 17,000+ | Класифікація | 2016 (2018) | Queen Mary University and IEEE Signal Processing Society | |||
WSJ0 Hipster Ambient Mixtures | Аудіо з WSJ0 змішано з шумом, записаним у районі затоки Сан-Франциско | Кліпи з шумом, відповідні кліпам WSJ0 | 28,000 | Звук(WAV) | Розділення джерел звуку | 2019 | Wichern, G., et al., Whisper and MERL | |
Clotho | 4981 звуковий зразок тривалістю від 15 до 30 секунд, кожен з яких має п’ять різних підписів довжиною від 8 до 20 слів. | 24,905 | Звук (WAV) та текст(CSV) | Автоматичні субтитри | 2020 | K. Drossos, S. Lipping, and T. Virtanen |
Дані сигналу
Набори даних, що містять інформацію про електричний сигнал, що вимагає певної обробки сигналу для подальшого аналізу.
Електричні
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створений | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Witty Worm Dataset | Набір даних із детальною інформацією про поширення хробака Witty та заражених комп’ютерів. | Розділіть на загальнодоступний набір і обмежений набір, що містить більш конфіденційну інформацію, як-от заголовки IP і UDP. | 55,909 IP addresses | Текст | Класифікація | 2004 | Center for Applied Internet Data Analysis | |
Cuff-Less Blood Pressure Estimation Dataset | Очищені життєво важливі сигнали від пацієнтів, які можна використовувати для оцінки артеріального тиску. | Життєві показники 125 Гц очищено. | 12,000 | Текст | Класифікація, регресія | 2015 | M. Kachuee et al. | |
Gas Sensor Array Drift Dataset | Вимірювання з 16 хімічних датчиків, використаних у моделюванні для компенсації дрейфу. | Велика кількість наданих функцій. | 13,910 | Текст | Класифікація | 2012 | A. Vergara | |
Servo Dataset | Дані, що охоплюють нелінійні співвідношення, що спостерігаються в схемі сервопідсилювача. | Наведено рівні різних компонентів як функції інших компонентів. | 167 | Текст | Регресія | 1993 | K. Ullrich | |
UJIIndoorLoc-Mag Dataset | База даних локалізації всередині приміщень для тестування внутрішніх систем позиціонування. Дані базуються на магнітному полі. | Дано розділи на тренування та тести. | 40,000 | Текст | Класифікація, регресія, кластеризація | 2015 | D. Rambla et al. | |
Sensorless Drive Diagnosis Dataset | Електричні сигнали від двигунів з несправними компонентами. | Вилучено статистичні ознаки. | 58,508 | Текст | Класифікація | 2015 | M. Bator |
Відстеження рух
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створенний | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Wearable Computing: Classification of Body Postures and Movements (PUC-Rio) | Люди, які виконують п’ять стандартних дій під час носіння трекерів руху. | Немає | 165,632 | Текст | Класифікація | 2013 | Pontifical Catholic University of Rio de Janeiro | |
Gesture Phase Segmentation Dataset | Функції, отримані з відео людей, які роблять різні жести. | Вилучені функції спрямовані на вивчення фазової сегментації жестів. | 9900 | Текст | Класифікація, кластеризація | 2014 | R. Madeo et a | |
Vicon Physical Action Data Set Dataset | 10 звичайних і 10 агресивних фізичних дій, які вимірюють активність людини, яку відстежує 3D-трекер. | Багато параметрів записує 3D трекер. | 3000 | Текст | Класифікація | 2011 | T. Theodoridis | |
Daily and Sports Activities Dataset | Дані датчиків двигуна для 19 щоденних і спортивних занять. | Надано багато датчиків, без попередньої обробки сигналів. | 9120 | Текст | Класифікація | 2013 | B. Barshan et al. | |
Human Activity Recognition Using Smartphones Dataset | Дані гіроскопа та акселерометра від людей, які носять смартфони та виконують звичайні дії. | Виконані дії позначаються, всі сигнали попередньо обробляються на наявність шуму. | 10,299 | Текст | Класифікація | 2012 | J. Reyes-Ortiz et al. | |
Australian Sign Language Signs | Австралійські знаки жестовою мовою, зняті рукавичками для відстеження руху. | Немає | 2565 | Текст | Класифікація | 2002 | M. Kadous | |
Weight Lifting Exercises monitored with Inertial Measurement Units | П’ять варіантів вправи на скручування біцепса, що контролюються за допомогою IMU. | Деякі статистичні дані, розраховані на основі необроблених даних. | 39,242 | Текст | Класифікація | 2013 | W. Ugulino et al. | |
sEMG for Basic Hand movements Dataset | Дві бази даних поверхневих електроміографічних сигналів 6 рухів рук. | Немає | 3000 | Текст | Класифікація | 2014 | C. Sapsanis et al. | |
REALDISP Activity Recognition Dataset | Оцініть методи, що стосуються впливу зміщення датчика при розпізнаванні активності, що можна носити. | Немає | 1419 | Текст | Класифікація | 2014 | O. Banos et al. | |
Heterogeneity Activity Recognition Dataset | Дані з кількох різних розумних пристроїв для людей, які виконують різні види діяльності. | Немає | 43,930,257 | Текст | Класифікація, кластеризація | 2015 | A. Stisen et al. | |
Indoor User Movement Prediction from RSS Data | Тимчасові дані бездротової мережі, які можна використовувати для відстеження переміщення людей в офісі. | Немає | 13,197 | Текст | Класифікація | 2016 | D. Bacciu | |
PAMAP2 Physical Activity Monitoring Dataset | 18 різних видів фізичних навантажень, які виконували 9 випробовуваних у 3 ІДУ. | Немає | 3,850,505 | Текст | Класифікація | 2012 | A. Reiss | |
OPPORTUNITY Activity Recognition Dataset | Розпізнавання людської активності від датчиків, які можна носити, об’єкта та навколишнього середовища – це набір даних, розроблений для порівняння алгоритмів розпізнавання людської діяльності. | Немає | 2551 | Текст | Класифікація | 2012 | D. Roggen et al. | |
Real World Activity Recognition Dataset | Розпізнавання людської діяльності за допомогою носових пристроїв. Розрізняє сім положень на корпусі пристрою та містить шість різних типів датчиків. | Немає | 3 150 000 (за датчик) | Текст | Класифікація | 2016 | T. Sztyler et al. | |
Toronto Rehab Stroke Pose Dataset | Тривимірні оцінки пози людини (Kinect) пацієнтів із інсультом та здорових учасників, які виконують набір завдань за допомогою робота для реабілітації після інсульту. | Немає | 10 здорових людей і 9 людей, які пережили інсульт (3500–6000 кадрів на людину) | CSV | Класифікація | 2017 | E. Dolatabadi et al. | |
Corpus of Social Touch (CoST) | 7805 жестів фіксують 14 різних жестів соціального дотику, виконаних 31 досліджуваним. Жести виконувались у трьох варіантах: ніжні, нормальні та грубі, на сітці датчика тиску, обмотаної навколо руки манекена. | Здійснювані сенсорні жести сегментовані та позначені. | 7805 зйомок жестів | CSV | Класифікація | 2016 | M. Jung et al. |
Інші сигнали
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Wine Dataset | Хімічний аналіз вин, вирощених в одному регіоні Італії, але отриманих з трьох різних сортів. | Наведено 13 властивостей кожного вина | 178 | Текст | Класифікація, регресія | 1991 | M. Forina et al. | |
Combined Cycle Power Plant Data Set | Дані від різних датчиків на електростанції, яка працює протягом 6 років. | Жодного | 9568 | Текст | Регресія | 2014 | P. Tufekci et al. |
Фізичні дані
Набори даних з фізичних систем.
Фізика високих енергій
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
HIGGS Dataset | Моделювання Монте-Карло зіткнень прискорювачів частинок. | Наведено 28 ознак кожного зіткнення. | 11M | Текст | Класифікація | 2014 | D. Whiteson | |
HEPMASS Dataset | Моделювання Монте-Карло зіткнень прискорювачів частинок. Мета – відокремити сигнал від шуму. | Наведено 28 ознак кожного зіткнення. | 10,500,000 | Текст | Класифікація | 2016 | D. Whiteson |
Системи
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Yacht Hydrodynamics Dataset | Продуктивність яхти на основі розмірів. | Для кожної яхти надано шість функцій. | 308 | Текст | Регресія | 2013 | R. Lopez | |
Robot Execution Failures Dataset | 5 наборів даних, які зосереджені на збій роботи роботів у виконанні звичайних завдань. | Цілочисельні функції, такі як крутний момент та інші вимірювання датчиків. | 463 | Текст | Класифікація | 1999 | L. Seabra et al. | |
Pittsburgh Bridges Dataset | Опис конструкції дається з точки зору кількох властивостей різних мостів. | Наведено різні особливості мосту. | 108 | Текст | Класифікація | 1990 | Y. Reich et al. | |
Automobile Dataset | Дані про автомобілі, їх страховий ризик та нормовані збитки. | Характеристики автомобіля вилучені. | 205 | Текст | Регресія | 1987 | J. Schimmer et al. | |
Auto MPG Dataset | Дані MPG для автомобілів. | Наведено вісім особливостей кожного автомобіля. | 398 | Текст | Регресія | 1993 | Carnegie Mellon University | |
Energy Efficiency Dataset | Вимоги до опалення та охолодження наведені як функція параметрів будівлі. | Параметри будівлі наведено. | 768 | Текст | Класифікація, регресія | 2012 | A. Xifara et al. | |
Airfoil Self-Noise Dataset | Серія аеродинамічних та акустичних випробувань дво- та тривимірних секцій лопаті аеродинамічного профілю. | Наведено дані про частоту, кут атаки тощо. | 1503 | Текст | Регресія | 2014 | R. Lopez | |
Challenger USA Space Shuttle O-Ring Dataset | Спробуйте передбачити проблеми з ущільнювальними кільцями, враховуючи попередні дані Challenger. | Наведено кілька особливостей кожного польоту, наприклад, температура запуску. | 23 | Текст | Регресія | 1993 | D. Draper et al. | |
Statlog (Shuttle) Dataset | Набори даних космічного човника NASA. | Надано дев’ять ознак. | 58,000 | Текст | Класифікація | 2002 | NASA |
Астрономія
Назва | Опис | Обробка | Розмір | Формат | Задача | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Volcanoes on Venus – JARtool experiment Dataset | Зображення Венери, отримані космічним кораблем Магеллан. | Зображення позначаються людьми. | not given | Зображення | Класифікація | 1991 | M. Burl | |
MAGIC Gamma Telescope Dataset | Монте-Карло генерував події високої енергії гамма-частинок. | Численні функції, отримані з моделювання. | 19,020 | Текст | Класифікаціяion | 2007 | R. Bock | |
Solar Flare Dataset | Вимірювання кількості певних типів сонячних спалахів, що відбуваються протягом 24 годин. | Надано багато специфічних особливостей сонячних спалахів. | 1389 | Текст | Розділення джерела звуку | 1989 | G. Bradshaw | |
CAMELS Multifield Dataset | 2D-карти та 3D-сітки з тисяч N-тіл і найсучасніших гідродинамічних симуляцій, що охоплюють широкий діапазон значень космологічних і астрофізичних параметрів | Кожна карта та сітка мають 6 космологічних та астрофізичних параметрів, пов’язаних з нею | 405,000 2D maps and 405,000 3D grids | 2D maps and 3D grids | Регресія | 2021 | Francisco Villaescusa-Navarro et al. |
Наука про Землю
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Volcanoes of the World | Дані про виверження вулканів для всіх відомих вулканічних подій на Землі. | Наведено такі деталі, як регіон, субрегіон, тектонічні умови, домінуючий тип гірських порід. | 1535 | Текст | Регресія, класифікація | 2013 | E. Venzke et al. | |
Seismic-bumps Dataset | Сейсмічна діяльність на вугільній шахті. | Сейсмічна активність була класифікована як небезпечна чи ні. | 2584 | Текст | Класифікація | 2013 | M. Sikora et al. | |
CAMELS-US | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 671 | CSV, Text, Shapefile | Регресія | 2017 | N. Addor et al. / A. Newman et al. | |
CAMELS-Chile | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 516 | CSV, Text, Shapefile | Регресія | 2018 | C. Alvarez-Garreton et al. | |
CAMELS-Brazil | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 897 | CSV, Text, Shapefile | Регресія | 2020 | V. Chagas et al. | |
CAMELS-GB | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 671 | CSV, Text, Shapefile | Регресія | 2020 | G. Coxon et al. | |
CAMELS-Australia | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 222 | CSV, Text, Shapefile | Регресія | 2021 | K. Fowler et al. | |
LamaH-CE | Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами | див. Посилання | 859 | CSV, Text, Shapefile | Регресія | 2021 | C. Klingler et al. |
Інші фізичні
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створений | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Concrete Compressive Strength Dataset | Набір даних про властивості бетону та міцність на стиск. | Для кожного зразка надано дев’ять ознак. | 1030 | Текст | Регресія | 2007 | I. Yeh | |
Concrete Slump Test Dataset | Осадка бетону наведена з точки зору властивостей. | Наведені характеристики бетону, такі як летюча зола, вода тощо. | 103 | Текст | Регресія | 2009 | I. Yeh | |
Musk Dataset | Спрогнозуйте, чи буде молекула, враховуючи особливості, мускусом чи немускусом. | Для кожної молекули наведено 168 ознак. | 6598 | Текст | Класифікація | 1994 | Arris Pharmaceutical Corp. | |
Steel Plates Faults Dataset | Сталеві пластини 7 різних типів. | Для кожного зразка наведено 27 ознак. | 1941 | Текст | Класифікація | 2010 | Semeion Research Center |
Біологічні дані
Набори даних з біологічних систем.
Соціальні
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Synthetic Fundus Dataset | Фотореалістичні зображення сітківки та сегментації судин. Публічний домен. | 2500 зображень з роздільністю 1500*1152 пікселів, корисних для сегментації та класифікації вен і артерій на одному фоні. | 2500 | Зображення | Класифікація, сегментація | 2020 | C. Valenti et al. | |
EEG Database | Дослідження для вивчення корелятів ЕЕГ генетичної схильності до алкоголізму. | Вимірювання за допомогою 64 електродів, розміщених на шкірі голови, відбираються при частоті 256 Гц (епоха 3,9 мс) протягом 1 секунди. | 122 | Текст | Класифікація | 1999 | H. Begleiter | |
P300 Interface Dataset | Дані від дев’яти суб’єктів, зібрані за допомогою інтерфейсу «мозок-комп’ютер» на основі P300 для суб’єктів з обмеженими можливостями. | Розділіть на чотири заняття для кожного предмета. Дано код MATLAB. | 1,224 | Текст | Класифікація | 2008 | U. Hoffman et al. | |
Heart Disease Data Set | Приписують пацієнтів із серцевими захворюваннями та без них. | 75 атрибутів, наданих для кожного пацієнта з деякими відсутніми значеннями. | 303 | Текст | Класифікація | 1988 | A. Janosi et al. | |
Breast Cancer Wisconsin (Diagnostic) Dataset | Набір даних про особливості утворення грудей. Діагноз ставить лікар. | Наведено 10 ознак для кожного зразка. | 569 | Текст | Класифікація | 1995 | W. Wolberg et al. | |
National Survey on Drug Use and Health | Широкомасштабне дослідження здоров'я та вживання наркотиків у Сполучених Штатах. | Немає | 55,268 | Текст | Класифікація, регресія | 2012 | United States Department of Health and Human Services | |
Lung Cancer Dataset | Набір даних про рак легенів без визначення атрибутів | Для кожного випадку наведено 56 ознак | 32 | Текст | Класифікація | 1992 | Z. Hong et al. | |
Arrhythmia Dataset | Дані для групи пацієнтів, з яких у деяких спостерігається серцева аритмія. | 276 функцій для кожного екземпляра. | 452 | Текст | Класифікація | 1998 | H. Altay et al. | |
Diabetes 130-US hospitals for years 1999–2008 Dataset | Дані про реадмісію за 9 років у 130 американських лікарнях для пацієнтів з цукровим діабетом. | Наведено багато особливостей кожної реадмісії. | 100,000 | Текст | Класифікація, кластеризація | 2014 | J. Clore et al. | |
Diabetic Retinopathy Debrecen Dataset | Характеристики, отримані із зображень очей з діабетичною ретинопатією та без неї. | Вилучено ознаки та діагностовано умови. | 1151 | Текст | Класифікація | 2014 | B. Antal et al. | |
Diabetic Retinopathy Messidor Dataset | Методи оцінки методів сегментації та індексації в області офтальмології сітківки (MESSIDOR) | Характеризує ступінь ретинопатії та ризик розвитку макулярного набряку | 1200 | Зображення, текст | Класифікація, сегментація | 2008 | Messidor Project | |
Liver Disorders Dataset | Дані для людей із захворюваннями печінки. | Для кожного пацієнта наведено сім біологічних ознак. | 345 | Текст | Класифікація | 1990 | Bupa Medical Research Ltd. | |
Thyroid Disease Dataset | 10 баз даних пацієнтів із захворюваннями щитовидної залози. | Немає | 7200 | Текст | Класифікація | 1987 | R. Quinlan | |
Mesothelioma Dataset | Дані пацієнтів з мезотеліомою. | Наведено велику кількість особливостей, включаючи вплив азбесту. | 324 | TextТекст | Класифікація2016 | A. Tanrikulu et al. | ||
Parkinson's Vision-Based Pose Estimation Dataset | 2D оцінки пози людини пацієнтів з хворобою Паркінсона, які виконують різноманітні завдання. | Тремтіння камери вилучено з траєкторій. | 134 | Текст | Класифікація, регресія | 2017 | M. Li et al. | |
KEGG Metabolic Reaction Network (Undirected) Dataset | Мережа метаболічних шляхів. Дано мережу реакцій і мережу відношень. | Наведено детальні характеристики для кожного вузла мережі та шляху. | 65,554 | Текст | Класифікація, кластеризація, регресія | 2011 | M. Naeem et al. | |
Modified Human Sperm Morphology Analysis Dataset (MHSMA) | Зображення сперми людини 235 пацієнтів з чоловічим фактором безпліддя, позначені для нормальної або аномальної сперматозоїди акросоми, головки, вакуолі та хвоста. | Обрізаний навколо однієї головки сперматозоїда. Нормалізоване збільшення. Створено розділи для навчання, перевірки та тестування. | 1,540 | .npy files | Класифікація | 2019 | S. Javadi and S.A. Mirroshandel |
Тварини
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Abalone Dataset | Фізичні вимірювання вушка. Також вказано погодні умови та місце розташування | Немає | 4177 | Текст | Регресія | 1995 | Marine Research Laboratories – Taroona | |
Zoo Dataset | Штучний набір даних, що охоплює 7 класів тварин. | Тварини поділяються на 7 категорій, для кожної наведені особливості. | 101 | Текст | Класифікація | 1990 | R. Forsyth | |
Demospongiae Dataset | Дані про морських губках. | 503 губки класу Demosponge описуються різними ознаками. | 503 | Текст | Класифікація | 2010 | E. Armengol et al. | |
Farm animals data | Інвентаризація даних PLF (корови, свині; розташування, прискорення тощо). | Марковані набори даних. | Список постійно оновлюється | Текст | Класифікація | 2020 | V. Bloch | |
Splice-junction Gene Sequences Dataset | Послідовності генів з’єднання приматів (ДНК) з асоційованою недосконалою теорією домену. | Немає | 3190 | Текст | Класифікація | 1992 | G. Towell et al. | |
Mice Protein Expression Dataset | Рівні експресії 77 білків виміряли в корі головного мозку мишей. | Немає | 1080 | Текст | Класифікація, кластеризація | 2015 | C. Higuera et al. |
Гибкий
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
UCI Mushroom Dataset | Ознаки та класифікація грибів | Наведено багато властивостей кожного гриба. | 8124 | Текст | Класифікація | 1987 | J. Schlimmer | |
Secondary Mushroom Dataset | Ознаки та класифікація грибів | Змодельовані дані з більших і реалістичніших первинних записів грибів. Повністю відтворюваний. | 61069 | Текст | Класифікація | 2020 | D. Wagner et al. |
Рослини
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Forest Fires Dataset | Лісові пожежі та їх властивості. | Вилучено 13 ознак кожної пожежі. | 517 | Текст | Регресія | 2008 | P. Cortez et al. | |
Iris Dataset | Три типи ірисів описуються 4 різними ознаками. | Немає | 150 | Текст | Класифікація | 1936 | R. Fisher | |
Plant Species Leaves Dataset | Шістнадцять зразків листя кожного із ста видів рослин. | Дано дескриптор форми, дрібномасштабне поле та гістограми текстури. | 1600 | Текст | Класифікація | 2012 | J. Cope et al. | |
Soybean Dataset | База даних хворих рослин сої. | Наведено 35 ознак для кожної рослини. Рослини поділяються на 19 категорій. | 307 | Текст | Класифікація | 1988 | R. Michalski et al. | |
Seeds Dataset | Вимірювання геометричних властивостей ядер трьох різних сортів пшениці. | Немає | 210 | Текст | Класифікація, кластеризація | 2012 | Charytanowicz et al. | |
Covertype Dataset | мДані для прогнозування типу лісистості суворо на основі картографічних змінних. | Наведено багато географічних об’єктів. | 581,012 | Текст | Класифікація | 1998 | J. Blackard et al. | |
Abscisic Acid Signaling Network Dataset | Дані для мережі сигналізації заводу. Мета – визначити набір правил, які керують мережею. | Немає | 300 | Текст | Причинно-відкриття | 2008 | J. Jenkens et al. | |
Folio Dataset | 20 фотографій листя для кожного з 32 видів. | Немає | 637 | Зображення, текст | Класифікація, виявлення | 2015 | T. Munisami et al. | |
Oxford Flower Dataset | Набір даних квітів 17 категорії. | Розділи поїздів/тестів, позначені зображення, | 1360 | Зображення, текст | Класифікація | 2006 | M-E Nilsback et al. | |
Plant Seedlings Dataset | Набір даних 12 категорії саджанців рослин. | Марковані зображення, сегментовані зображення,Марковані зображення, сегментовані зображення, | 5544 | Зображення | Класифікація, виявлення | 2017 | Giselsson et al. | |
Fruits 360 dataset | База даних із зображеннями 120 фруктів і овочів. | 100x100 пікселів, білий фон. | 82213 | Зображення(jpg) | Класифікація | 2017–2019 | Mihai Oltean, Horea Muresan |
Мікроб
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Ecoli Dataset | Місця локалізації білків. | Наведено різні особливості місць локалізації білків. | 336 | Текст | Класифікація | 1996 | K. Nakai et al. | |
MicroMass Dataset | Ідентифікація мікроорганізмів за даними мас-спектрометрії. | Різні функції мас-спектрометра. | 931 | Текст | Класифікація | 2013 | P. Mahe et al. | |
Yeast Dataset | Прогнозування клітинної локалізації білків. | Вісім функцій наведено для кожного випадку. | 1484 | Текст | Класифікація | 1996 | K. Nakai et al. |
Відкриття наркотиків
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Tox21 Dataset | Прогнозування результатів біологічних аналізів. | Наведено хімічні дескриптори молекул | 12707 | Текст | Класифікація | 2016 | A. Mayr et al. |
Дані про аномалії
Dataset Name | Brief description | Preprocessing | Instances | Format | Default Task | Created (updated) | Reference | Creator |
---|---|---|---|---|---|---|---|---|
Numenta Anomaly Benchmark (NAB) | Дані впорядковані, з мітками часу, однозначні метрики. Усі файли даних містять аномалії, якщо не зазначено інше. | Немає | 50+ files | Значення, розділені комами | Виявлення аномалій | 2016 (постійно оновлюється) | Numenta | |
Skoltech Anomaly Benchmark (SKAB) | Кожен файл представляє один експеримент і містить одну аномалію. Набір даних являє собою багатоваріантний часовий ряд, зібраний із датчиків, встановлених на тестовому стенді. | Є дві розмітки для проблем виявлення викидів (точкові аномалії) та виявлення точок змін (колективні аномалії). | 30+ files (v0.9) | Значення, розділені комами | Виявлення аномалій | 2020 (постійно оновлюється) | Iurii D. Katser and Vyacheslav O. Kozitsin | |
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study | Більшість файлів даних адаптовано з даних репозитарію машинного навчання UCI, деякі зібрані з літератури. | обробляються відсутні значення, лише числові атрибути, різні відсотки аномалій, мітки | 1000+ files | ARFF | Виявлення аномалій | 2016 (можливо, оновлено новими наборами даних та/або результатами) | Campos et al. |
Відповіді на питання
Цей розділ містить набори даних, які мають справу зі структурованими даними.
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
DBpedia Neural Question Answering (DBNQA) Dataset | Велика колекція Question to SPARQL, спеціально розроблена для відповіді на нейронні запитання відкритого домену через базу знань DBpedia. | Цей набір даних містить велику колекцію відкритих шаблонів Neural SPARQL та екземплярів для навчання машин Neural SPARQL; він був попередньо оброблений напівавтоматичними інструментами анотації, а також трьома експертами SPARQL. | 894,499 | Пари питання-запит | Відповідь на запитання | 2018 | Hartmann, Soru, and Marx et al. | |
Vietnamese Question Answering Dataset (UIT-ViQuAD) | Велика колекція в'єтнамських питань для оцінки моделей MRC. | Цей набір даних містить понад 23 000 створених людьми пар питань і відповідей на основі 5 109 уривків із 174 в’єтнамських статей з Вікіпедії. | 23,074 | Пари питання-запит | Відповідь на запитання | 2020 | Nguyen et al. | |
Vietnamese Multiple-Choice Machine Reading Comprehension Corpus(ViMMRC) | Колекція в’єтнамських питань з кількома відповідями для оцінки моделей MRC. | Цей корпус включає 2783 в’єтнамські запитання з кількома відповідями. | 2,783 | Пари питання-запит | Відповідь на запитання/Машинне розуміння прочитаного | 2020 | Nguyen et al. |
Багатоваріантні дані
Набори даних, що складаються з рядків спостережень і стовпців атрибутів, що характеризують ці спостереження. Зазвичай використовується для регресійного аналізу або класифікації, але можуть використовуватися й інші типи алгоритмів. Цей розділ містить набори даних, які не вписуються в вищезазначені категорії.
Фінанси
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Dow Jones Index | Щотижневі дані запасів за І-ІІ квартали 2011 року. | Розраховані значення включали такі, як відсоткова зміна та лаги. | 750 | Значення, розділені комами | Класифікація, регресія, часові ряди | 2014 | M. Brown et al. | |
Statlog (Australian Credit Approval) | Заявки на кредитні картки прийняті або відхилені та атрибути програми. | Назви атрибутів видаляються, а також ідентифікаційна інформація. Фактори були перемарковані. | 690 | Значення, розділені комами | Класифікація | 1987 | R. Quinlan | |
eBay auction data | Дані аукціону з різних об’єктів eBay.com на аукціонах різної тривалості | Містить усі ставки, ідентифікатор ставки, час ставок та ціни відкриття. | ~ 550 | Текст | Регресія, класифікація | 2012 | G. Shmueli et al. | |
Statlog (German Credit Data) | Бінарна класифікація кредиту на «хороша» або «погана» з багатьма ознаками | Наведено різні фінансові особливості кожної людини. | 690 | Текст | Класифікація | 1994 | H. Hofmann | |
Bank Marketing Dataset | Дані великої маркетингової кампанії, проведеної великим банком. | Наведено багато атрибутів клієнтів, до яких звертаються. Якщо клієнт підписався на банк також надається. | 45,211 | Текст | Класифікація | 2012 | S. Moro et al. | |
Istanbul Stock Exchange Dataset | Декілька фондових індексів відстежувалися майже два роки. | Немає | 536 | Текст | Класифікація, регресія | 2013 | O. Akbilgic | |
Default of Credit Card Clients | Дані про дефолт для тайванських кредиторів. | Для кожного облікового запису надаються різні функції. | 30,000 | Текст | Класифікація | 2016 | I. Yeh |
Погода
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створенная | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Cloud DataSet | Дані про 1024 різних хмарах. | Вилучено характеристики зображення. | 1024 | Текст | Класифікація, кластеризація | 1989 | P. Collard | |
El Nino Dataset | Океанографічні та приземні метеорологічні показання, отримані з серії буїв, розташованих по всій екваторіальній частині Тихого океану. | На кожному буї вимірюється 12 погодних атрибутів. | 178080 | Текст | Регресія | 1999 | Pacific Marine Environmental Laboratory | |
Greenhouse Gas Observing Network Dataset | Часовий ряд концентрацій парникових газів у 2921 осередку сітки в Каліфорнії створений за допомогою моделювання погоди. | Немає | 2921 | Текст | Регресія | 2015 | D. Lucas | |
Atmospheric CO2 from Continuous Air Samples at Mauna Loa Observatory | Безперервні проби повітря на Гаваях, США. 44 роки рекордів. | Немає | 44 years | Текст | Регресія | 2001 | Mauna Loa Observatory | |
Ionosphere Dataset | Радарні дані з іоносфери. Завдання — розділити на хороші та погані результати радіолокації. | Немає | 351 | Текст | Класифікація | 1989 | Johns Hopkins University | |
Ozone Level Detection Dataset | Два набори даних про рівень озону на землі. | Надано багато функцій, включаючи погодні умови на момент вимірювання. | 2536 | Текст | Класифікація | 2008 | K. Zhang et al. |
Перепис населення
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створенная | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Adult Dataset | Дані перепису 1994 року, що містять демографічні ознаки дорослих та їхні доходи. | Очищено та анонімно. | 48,842 | Значення, розділені комами | Класифікація | 1996 | United States Census Bureau | |
Census-Income (KDD) | Зважені дані перепису з поточних опитувань населення 1994 та 1995 років. | Розділіть на навчальні та тестові набори. | 299,285 | Значення, розділені комами | Класифікація | 2000 | United States Census Bureau | |
IPUMS Census Database | Дані перепису з районів Лос-Анджелеса та Лонг-Біч. | Немає | 256,932 | Текст | Класифікація, регресія | 1999 | IPUMS | |
US Census Data 1990 | Часткові дані перепису населення США 1990 року. | Результати рандомізовані та вибрані корисні атрибути. | 2,458,285 | Текст | Класифікація, регресія | 1990 | United States Census Bureau |
Транзит
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Bike Sharing Dataset | Погодинний і добовий підрахунок прокату велосипедів у великому місті. | Надано багато функцій, включаючи погоду, тривалість подорожі тощо. | 17,389 | Текст | Регресія | 2013 | H. Fanaee-T | |
New York City Taxi Trip Data | Дані про подорожі жовтих і зелених таксі в Нью-Йорку. | Вказує місця посадки та висадки, тарифи та інші деталі поїздок. | 6 years | Текст | Класифікація, кластеризація | 2015 | New York City Taxi and Limousine Commission | |
Taxi Service Trajectory ECML PKDD | Траєкторії всіх таксі у великому місті. | Надано багато функцій, включаючи точки початку та зупинки. | 1,710,671 | Текст | Кластеризація, причинно-наслідкове відкриття | 2015 | M. Ferreira et al. | |
METR-LA | Швидкість від петлеві детекторів на шосе округу Лос-Анджелес.. | Середня швидкість за 5 хвилин. | 7 094 304 з 207 датчиків і 34 272 кроків | Значення, розділені комами | Регресія, прогнозування | 2014 | Jagadish et al. | |
PeMS | Швидкість, потік, зайнятість та інші показники від петлевих детекторів та інших датчиків на автостраді штату Каліфорнія, США. | Показник зазвичай зводиться до середнього з 5-хвилинними часовими кроками. | 39 000 індивідуальних детекторів, кожен із яких містить ряди часу | Значення, розділені комами | Регресія, прогнозування, прогнозування, інтерполяція | (оновлено в режимі реального часу) | California Department of Transportation |
Інтернет
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Webpages from Common Crawl 2012 | Велика колекція веб-сторінок і спосіб їх з’єднання за допомогою гіперпосилань | Немає | 3.5B | Текст | кластеризація, класифікація | 2013 | V. Granville | |
Internet Advertisements Dataset | Набір даних для прогнозування того, чи є дане зображення рекламою чи ні. | Функції кодують геометрію оголошень і фраз, що зустрічаються в URL-адресі. | 3279 | Текст | Класифікація | 1998 | N. Kushmerick | |
Internet Usage Dataset | Загальна демографічна характеристика користувачів Інтернету. | Немає | 10,104 | Текст | Класифікація, кластеризація | 1999 | D. Cook | |
URL Dataset | 120 днів URL-адрес великої конференції. | Наведено багато функцій кожної URL-адреси. | 2,396,130 | Текст | Класифікація | 2009 | J. Ma | |
Phishing Websites Dataset | Набір даних фішингових веб-сайтів. | MНаведено багато функцій кожного сайту. | 2456 | Текст | Класифікація | 2015 | R. Mustafa et al. | |
Online Retail Dataset | Онлайн-транзакції для британського інтернет-магазину. | Дані деталі кожної транзакції. | 541,909 | Текст | Класифікація, кластеризація | 2015 | D. Chen | |
Freebase Simple Topic Dump | Freebase — це онлайн-інструмент структурування всіх людських знань. | Теми з Freebase були вилучені. | багато | Текст | Класифікація, кластеризація | 2011 | Freebase | |
Farm Ads Dataset | Текст реклами ферми з сайтів. Надається бінарне схвалення або відхилення власниками вмісту. | Розраховані SVMlight розріджені вектори текстових слів в оголошеннях. | 4143 | Текст | Класифікація | 2011 | C. Masterharm et al. |
Ігри
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Poker Hand Dataset | 5 карткових рук із стандартної колоди з 52 карт. | Надаються атрибути кожної руки, включаючи покерні руки, утворені картами, які вона містить. | 1,025,010 | Текст | Регресія, класифікація | 2007 | R. Cattral | |
Connect-4 Dataset | Містить усі дозволені 8-шарові позиції в грі Connect-4, в якій жоден із гравців ще не виграв і в якій наступний хід не вимушений. | Немає | 67,557 | Текст | Класифікація | 1995 | J. Tromp | |
Chess (King-Rook vs. King) Dataset | База даних фіналу для білого короля та лади проти чорного короля. | Немає | 28,056 | Текст | Класифікація | 1994 | M. Bain et al. | |
Chess (King-Rook vs. King-Pawn) Dataset | King+Rook versus King+Pawn on a7. | Немає | 3196 | Текст | Класифікація | 1989 | R. Holte | |
Tic-Tac-Toe Endgame Dataset | Бінарна класифікація умов виграшу в хрестики-нулики. | Немає | 958 | Текст | Класифікація | 1991 | D. Aha |
Інші багатоваріантості
Назва | Опис | Обробка | Розмір | Формат | Задачі | Створення | Посилання | Джерело |
---|---|---|---|---|---|---|---|---|
Housing Data Set | Середні значення будинку в Бостоні з пов’язаними атрибутами будинку та району. | Немає | 506 | Текст | Регресія | 1993 | D. Harrison et al. | |
The Getty Vocabularies | структурована термінологія художньої та іншої матеріальної культури, архівні матеріали, візуальні сурогати та бібліографічні матеріали. | Немає | багато | Текст | Класифікація | 2015 | Getty Center | |
Yahoo! Front Page Today Module User Click Log | Журнал кліків користувача для статей новин, які відображаються на вкладці "Вибрані" модуля Today на Yahoo! Титульна сторінка. | Сумісний аналіз з білінійною моделлю. | 45 811 883 відвідування користувачів | Текст | Регресія, кластеризація | 2009 | Chu et al. | |
British Oceanographic Data Centre | Біологічні, хімічні, фізичні та геофізичні дані для океанів. Відстежено 22 тис. змінних. | Різні. | 22 тис. змінних, багато екземплярів | Текст | Регресія, кластеризація | 2015 | British Oceanographic Data Centre | |
Congressional Voting Records Dataset | Дані голосування всіх представників США з 16 питань. | Детально записуються про використання програм кожним користувачем. | 435 | Текст | Класифікація | 1987 | J. Schlimmer | |
Entree Chicago Recommendation Dataset | Запис взаємодії користувачів із системою рекомендацій Entree Chicago. | Детально записуються дані про використання програми кожним користувачем. | 50,672 | Текст | Регресія, рекомендація | 2000 | R. Burke | |
Insurance Company Benchmark (COIL 2000) | Інформація про клієнтів страхової компанії. | Багато функцій кожного клієнта та послуг, якими вони користуються. | 9,000 | Текст | Регресія, класифікація | 2000 | P. van der Putten | |
Nursery Dataset | Дані від абітурієнтів до дитячих садків. | Включаються дані про сім'ю заявника та різні інші фактори. | 12,960 | Текст | Класифікація | 1997 | V. Rajkovic et al. | |
University Dataset | Дані, що описують атрибути великої кількості університетів. | Немає | 285 | Текст | Класифікація, кластеризація | 1988 | S. Sounders et al. | |
Blood Transfusion Service Center Dataset | Дані центру переливання крові. Надає дані про швидкість повернення донорів, частоту тощо. | Немає | 748 | Текст | Класифікація | 2008 | I. Yeh | |
Record Linkage Comparison Patterns Dataset | Великий набір записів. Завдання — зв’язати між собою відповідні записи. | Процедура блокування застосовується для вибору лише певних пар записів. | 5,749,132 | Текст | Класифікація | 2011 | University of Mainz | |
Nomao Dataset | Nomao збирає дані про місця з багатьох різних джерел. Завдання — виявити предмети, які описують одне й те саме місце. | Позначені копії. | 34,465 | Текст | Класифікація | 2012 | Nomao Labs | |
Movie Dataset | Дані для 10 000 фільмів. | Для кожного фільму надано кілька функцій. | 10,000 | Текст | Класифікація, кластеризація | 1999 | G. Wiederhold | |
Open University Learning Analytics Dataset | Інформація про студентів та їх взаємодію з віртуальним навчальним середовищем. | Жодного | ~ 30,000 | Текст | Класифікація, кластеризація, регресія | 2015 | J. Kuzilek et al. | |
Mobile phone records | Телекомунікаційна діяльність та взаємодії | Агрегація за клітинками географічної сітки та кожні 15 хвилин. | великий | Текст | Класифікація, кластеризація, регресія | 2015 | G. Barlacchi et al. |
Цю статтю треба вікіфікувати для відповідності стандартам якості Вікіпедії. (травень 2017) |
Це незавершена стаття зі штучного інтелекту. Ви можете допомогти проєкту, виправивши або дописавши її. |
Примітки
- ↑ Phillips, P. Jonathon, et al. "The FERET database and evaluation procedure for face-recognition algorithms." Image and vision computing 16.5 (1998): 295-306.
- ↑ Wiskott, Laurenz, et al. "Face recognition by elastic bunch graph matching."Pattern Analysis and Machine Intelligence, IEEE Transactions on 19.7 (1997): 775-779.
- ↑ Sim, Terence, Simon Baker, and Maan Bsat. "The CMU pose, illumination, and expression (PIE) database." Automatic Face and Gesture Recognition, 2002. Proceedings. Fifth IEEE International Conference on. IEEE, 2002.
- ↑ Schroff, Florian, et al. "Pose, illumination and expression invariant pairwise face-similarity measure via doppelgänger list comparison."Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.
- ↑ Grgic, Mislav, Kresimir Delac, and Sonja Grgic. "SCface–surveillance cameras face database." Multimedia tools and applications 51.3 (2011): 863-879.
- ↑ Wallace, Roy, et al. "Inter-session variability modelling and joint factor analysis for face authentication." Biometrics (IJCB), 2011 International Joint Conference on. IEEE, 2011.
- ↑ Schroff, Florian, Dmitry Kalenichenko, and James Philbin. "Facenet: A unified embedding for face recognition and clustering." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2015.
- ↑ Wolf, Lior, Tal Hassner, and Itay Maoz. "Face recognition in unconstrained videos with matched background similarity." Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. IEEE, 2011.
- ↑ Shen, Jie, et al. "The first facial landmark tracking in-the-wild challenge: Benchmark and results." 2015 IEEE International Conference on Computer Vision Workshop (ICCVW). IEEE, 2015.
- ↑ de Almeida Freitas, Fernando, et al. "Grammatical Facial Expressions Recognition with Machine Learning." FLAIRS Conference. 2014.
- ↑ Mitchell, Tom M. "Machine learning. WCB." (1997).
- ↑ Xiaofeng He and Partha Niyogi. Locality Preserving Projections. NIPS. 2003.
- ↑ Georghiades, A. "Yale face database." Center for computational Vision and Control at Yale University, http://cvc. yale. edu/projects/yalefaces/yalefa 2 (1997).
- ↑ Nguyen, Duy, et al. "Real-time face detection and lip feature extraction using field-programmable gate arrays." Systems, Man, and Cybernetics, Part B: Cybernetics, IEEE Transactions on 36.4 (2006): 902-912.
- ↑ Kanade, Takeo, Jeffrey F. Cohn, and Yingli Tian. "Comprehensive database for facial expression analysis." Automatic Face and Gesture Recognition, 2000. Proceedings. Fourth IEEE International Conference on. IEEE, 2000.
- ↑ Zeng, Zhihong, et al. "A survey of affect recognition methods: Audio, visual, and spontaneous expressions." Pattern Analysis and Machine Intelligence, IEEE Transactions on 31.1 (2009): 39-58.
- ↑ Ng, Hong-Wei, and Stefan Winkler. "A data-driven approach to cleaning large face datasets." Image Processing (ICIP), 2014 IEEE International Conference on. IEEE, 2014.
- ↑ RoyChowdhury, Aruni; Lin, Tsung-Yu; Maji, Subhransu; Learned-Miller, Erik (2015). One-to-many face recognition with bilinear CNNs. arXiv:1506.01342 [cs.CV].
- ↑ Jesorsky, Oliver, Klaus J. Kirchberg, and Robert W. Frischholz. "Robust face detection using the hausdorff distance." Audio-and video-based biometric person authentication. Springer Berlin Heidelberg, 2001.
- ↑ Huang, Gary B., et al. Labeled faces in the wild: A database for studying face recognition in unconstrained environments. Vol. 1. No. 2. Technical Report 07-49, University of Massachusetts, Amherst, 2007.
- ↑ Bhatt, Rajen B., et al. "Efficient skin region segmentation using low complexity fuzzy decision tree model." India Conference (INDICON), 2009 Annual IEEE. IEEE, 2009.
- ↑ Lingala, Mounika, et al. "Fuzzy logic color detection: Blue areas in melanoma dermoscopy images." Computerized Medical Imaging and Graphics 38.5 (2014): 403-410.
- ↑ Maes, Chris, et al. "Feature detection on 3D face surfaces for pose normalisation and recognition." Biometrics: Theory Applications and Systems (BTAS), 2010 Fourth IEEE International Conference on. IEEE, 2010.
- ↑ Savran, Arman, et al. "Bosphorus database for 3D face analysis." Biometrics and Identity Management. Springer Berlin Heidelberg, 2008. 47-56.
- ↑ Heseltine, Thomas, Nick Pears, and Jim Austin. "Three-dimensional face recognition: An eigensurface approach." Image Processing, 2004. ICIP'04. 2004 International Conference on. Vol. 2. IEEE, 2004.
- ↑ Ge, Yun, et al. "3D Novel Face Sample Modeling for Face Recognition."Journal of Multimedia 6.5 (2011): 467-475.
- ↑ Wang, Yueming, Jianzhuang Liu, and Xiaoou Tang. "Robust 3D face recognition by local shape difference boosting." Pattern Analysis and Machine Intelligence, IEEE Transactions on 32.10 (2010): 1858–1870.
- ↑ Zhong, Cheng, Zhenan Sun, and Tieniu Tan. "Robust 3D face recognition using learned visual codebook." Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on. IEEE, 2007.
- ↑ Zhao, G., Huang, X., Taini, M., Li, S. Z., & Pietikäinen, M. (2011). Facial expression recognition from near-infrared videos. Image and Vision Computing, 29(9), 607-619.
- ↑ Soyel, Hamit, and Hasan Demirel. "Facial expression recognition using 3D facial feature distances." Image Analysis and Recognition. Springer Berlin Heidelberg, 2007. 831-838.
- ↑ Bowyer, Kevin W., Kyong Chang, and Patrick Flynn. "A survey of approaches and challenges in 3D and multi-modal 3D+ 2D face recognition." Computer vision and image understanding 101.1 (2006): 1-15.
- ↑ Tan, Xiaoyang, and Bill Triggs. "Enhanced local texture feature sets for face recognition under difficult lighting conditions." Image Processing, IEEE Transactions on 19.6 (2010): 1635–1650.
- ↑ Mousavi, Mir Hashem, Karim Faez, and Amin Asghari. "Three dimensional face recognition using SVM classifier." Computer and Information Science, 2008. ICIS 08. Seventh IEEE/ACIS International Conference on. IEEE, 2008.
- ↑ Amberg, Brian, Reinhard Knothe, and Thomas Vetter. "Expression invariant 3D face recognition with a morphable model." Automatic Face & Gesture Recognition, 2008. FG'08. 8th IEEE International Conference on. IEEE, 2008.
- ↑ İrfanoğlu, M. O., Berk Gökberk, and Lale Akarun. "3D shape-based face recognition using automatically registered facial surfaces." Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference on. Vol. 4. IEEE, 2004.
- ↑ Beumier, Charles, and Marc Acheroy. "Face verification from 3D and grey level clues." Pattern recognition letters 22.12 (2001): 1321–1329.
- ↑ Patron-Perez, Alonso; Marszalek, Marcin; Reid, Ian; Zisserman, Andrew (2012-12). Structured Learning of Human Interactions in TV Shows. IEEE Transactions on Pattern Analysis and Machine Intelligence. Т. 34, № 12. с. 2441—2453. doi:10.1109/TPAMI.2012.24. ISSN 1939-3539. Процитовано 20 травня 2022.
- ↑ Ofli, Ferda; Chaudhry, Rizwan; Kurillo, Gregorij; Vidal, Rene; Bajcsy, Ruzena (2013-01). Berkeley MHAD: A comprehensive Multimodal Human Action Database. 2013 IEEE Workshop on Applications of Computer Vision (WACV). IEEE. doi:10.1109/wacv.2013.6474999. Процитовано 20 травня 2022.
- ↑ N.Z.), Asian Conference on Pattern Recognition (5th : 2019 : Auckland,. Pattern recognition : 5th Asian Conference, ACPR 2019, Auckland, New Zealand, November 26-29, 2019, Revised selected papers. ISBN 978-3-030-41299-9. OCLC 1142374420.
- ↑ Rama., Zhao, Wenyi. Chellappa,. Face processing : advanced modeling and methods. ISBN 978-0-08-048884-4. OCLC 953864701.
- ↑ Krishna, Ranjay; Zhu, Yuke; Groth, Oliver; Johnson, Justin; Hata, Kenji; Kravitz, Joshua; Chen, Stephanie; Kalantidis, Yannis; Li, Li-Jia; Shamma, David A; Bernstein, Michael S; Fei-Fei, Li (2017). Visual Genome: Connecting Language and Vision Using Crowdsourced Dense Image Annotations. International Journal of Computer Vision. 123: 32—73. arXiv:1602.07332. doi:10.1007/s11263-016-0981-7.
- ↑ Pont-Tuset, Jordi; Perazzi, Federico; Caelles, Sergi; Arbeláez, Pablo; Sorkine-Hornung, Alex; Luc Van Gool (2017). The 2017 DAVIS Challenge on Video Object Segmentation. arXiv:1704.00675 [cs.CV].
- ↑ Perazzi, Federico; Pont-Tuset, Jordi; McWilliams, Brian; Van Gool, Luc; Gross, Markus; Sorkine-Hornung, Alex (2016). A Benchmark Dataset and Evaluation Methodology for Video Object Segmentation (PDF). Архів оригіналу (PDF) за 5 листопада 2020. Процитовано 7 вересня 2019.
- ↑ Hodan, T., et al. "T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects." Winter Conference on Applications of Computer Vision (WACV) 2017.
- ↑ Karayev, S., et al. "A category-level 3-D object dataset: putting the Kinect to work [Архівовано 21 грудня 2019 у Wayback Machine.]." Proceedings of the IEEE International Conference on Computer Vision Workshops. 2011.
- ↑ Tighe, Joseph, and Svetlana Lazebnik. "Superparsing: scalable nonparametric image parsing with superpixels [Архівовано 6 серпня 2019 у Wayback Machine.]." Computer Vision–ECCV 2010. Springer Berlin Heidelberg, 2010. 352–365.
- ↑ Arbelaez, P.; Maire, M; Fowlkes, C; Malik, J (May 2011). Contour Detection and Hierarchical Image Segmentation (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 33 (5): 898—916. doi:10.1109/tpami.2010.161. PMID 20733228. Архів оригіналу (PDF) за 8 травня 2012. Процитовано 27 лютого 2016.
- ↑ Lin, Tsung-Yi, et al. "Microsoft coco: Common objects in context." Computer Vision–ECCV 2014. Springer International Publishing, 2014. 740–755.
- ↑ Russakovsky, Olga та ін. (2015). Imagenet large scale visual recognition challenge. International Journal of Computer Vision. 115 (3): 211—252. arXiv:1409.0575. doi:10.1007/s11263-015-0816-y. hdl:1721.1/104944.
- ↑ COCO - Common Objects in Context. cocodataset.org. Архів оригіналу за 20 жовтня 2021. Процитовано 17 жовтня 2021.
- ↑ Xiao, Jianxiong, et al. "Sun database: Large-scale scene recognition from abbey to zoo." Computer vision and pattern recognition (CVPR), 2010 IEEE conference on. IEEE, 2010.
- ↑ Donahue, Jeff; Jia, Yangqing; Vinyals, Oriol; Hoffman, Judy; Zhang, Ning; Tzeng, Eric; Darrell, Trevor (2013). DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition. arXiv:1310.1531 [cs.CV].
- ↑ Deng, Jia, et al. "Imagenet: A large-scale hierarchical image database."Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on. IEEE, 2009.
- ↑ а б в Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks [Архівовано 31 серпня 2019 у Wayback Machine.]." Advances in neural information processing systems. 2012.
- ↑ Russakovsky, Olga; Deng, Jia; Su, Hao; Krause, Jonathan; Satheesh, Sanjeev та ін. (11 квітня 2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision. 115 (3): 211—252. arXiv:1409.0575. doi:10.1007/s11263-015-0816-y. hdl:1721.1/104944.
- ↑ Ivan Krasin, Tom Duerig, Neil Alldrin, Andreas Veit, Sami Abu-El-Haija, Serge Belongie, David Cai, Zheyun Feng, Vittorio Ferrari, Victor Gomes, Abhinav Gupta, Dhyanesh Narayanan, Chen Sun, Gal Chechik, Kevin Murphy. "OpenImages: A public dataset for large-scale multi-label and multi-class image classification, 2017. Available from https://github.com/openimages [Архівовано 14 квітня 2020 у Wayback Machine.]."
- ↑ Vyas, Apoorv, et al. "Commercial Block Detection in Broadcast News Videos." Proceedings of the 2014 Indian Conference on Computer Vision Graphics and Image Processing. ACM, 2014.
- ↑ Hauptmann, Alexander G., and Michael J. Witbrock. "Story segmentation and detection of commercials in broadcast news video." Research and Technology Advances in Digital Libraries, 1998. ADL 98. Proceedings. IEEE International Forum on. IEEE, 1998.
- ↑ Tung, Anthony KH, Xin Xu, and Beng Chin Ooi. "Curler: finding and visualizing nonlinear correlation clusters [Архівовано 6 серпня 2019 у Wayback Machine.]." Proceedings of the 2005 ACM SIGMOD international conference on Management of data. ACM, 2005.
- ↑ Jarrett, Kevin, et al. "What is the best multi-stage architecture for object recognition? [Архівовано 6 серпня 2019 у Wayback Machine.]." Computer Vision, 2009 IEEE 12th International Conference on. IEEE, 2009.
- ↑ Lazebnik, Svetlana, Cordelia Schmid, and Jean Ponce. "Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories [Архівовано 6 серпня 2019 у Wayback Machine.]."Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on. Vol. 2. IEEE, 2006.
- ↑ Griffin, G., A. Holub, and P. Perona. Caltech-256 object category dataset California Inst. Technol., Tech. Rep. 7694, 2007 [Online]. Available: http://authors.library.caltech.edu/7694 [Архівовано 7 липня 2019 у Wayback Machine.] , 2007.
- ↑ Baeza-Yates, Ricardo, and Berthier Ribeiro-Neto. Modern information retrieval. Vol. 463. New York: ACM press, 1999.
- ↑ Fu, Xiping, et al. "NOKMeans: Non-Orthogonal K-means Hashing." Computer Vision—ACCV 2014. Springer International Publishing, 2014. 162–177.
- ↑ Heitz, Geremy та ін. (2009). Shape-based object localization for descriptive classification. International Journal of Computer Vision. 84 (1): 40—62. CiteSeerX 10.1.1.142.280. doi:10.1007/s11263-009-0228-y.
- ↑ M. Cordts, M. Omran, S. Ramos, T. Scharwächter, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, "The Cityscapes Dataset [Архівовано 17 квітня 2020 у Wayback Machine.]." In CVPR Workshop on The Future of Datasets in Vision, 2015.
- ↑ Everingham, Mark та ін. (2010). The pascal visual object classes (voc) challenge. International Journal of Computer Vision. 88 (2): 303—338. doi:10.1007/s11263-009-0275-4.
- ↑ Felzenszwalb, Pedro F. та ін. (2010). Object detection with discriminatively trained part-based models. IEEE Transactions on Pattern Analysis and Machine Intelligence. 32 (9): 1627—1645. CiteSeerX 10.1.1.153.2745. doi:10.1109/tpami.2009.167. PMID 20634557.
- ↑ а б Gong, Yunchao, and Svetlana Lazebnik. "Iterative quantization: A procrustean approach to learning binary codes." Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. IEEE, 2011.
- ↑ CINIC-10 dataset. Luke N. Darlow, Elliot J. Crowley, Antreas Antoniou, Amos J. Storkey (2018) CINIC-10 is not ImageNet or CIFAR-10. 9 жовтня 2018. Архів оригіналу за 12 листопада 2018. Процитовано 13 листопада 2018.
- ↑ fashion-mnist: A MNIST-like fashion product database. Benchmark :point_right, Zalando Research, 7 жовтня 2017, архів оригіналу за 20 липня 2019, процитовано 7 жовтня 2017
- ↑ notMNIST dataset. Machine Learning, etc. 8 вересня 2011. Архів оригіналу за 1 вересня 2019. Процитовано 13 жовтня 2017.
- ↑ Houben, Sebastian, et al. "Detection of traffic signs in real-world images: The German Traffic Sign Detection Benchmark." Neural Networks (IJCNN), The 2013 International Joint Conference on. IEEE, 2013.
- ↑ Mathias, Mayeul, et al. "Traffic sign recognition—How far are we from the solution? [Архівовано 30 грудня 2020 у Wayback Machine.]." Neural Networks (IJCNN), The 2013 International Joint Conference on. IEEE, 2013.
- ↑ Geiger, Andreas, Philip Lenz, and Raquel Urtasun. "Are we ready for autonomous driving? the kitti vision benchmark suite [Архівовано 22 грудня 2018 у Wayback Machine.]." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.
- ↑ Sturm, Jürgen, et al. "A benchmark for the evaluation of RGB-D SLAM systems [Архівовано 12 липня 2019 у Wayback Machine.]." Intelligent Robots and Systems (IROS), 2012 IEEE/RSJ International Conference on. IEEE, 2012.
- ↑ The KITTI Vision Benchmark Suite на YouTube (англ.)
- ↑ Chaladze, G., Kalatozishvili, L. (2017). Linnaeus 5 dataset. Chaladze.com. Retrieved 13 November 2017, from http://chaladze.com/l5/ [Архівовано 25 серпня 2019 у Wayback Machine.]
- ↑ Kragh, Mikkel F. та ін. (2017). FieldSAFE – Dataset for Obstacle Detection in Agriculture. Sensors. 17 (11): 2579. doi:10.3390/s17112579. PMC 5713196. PMID 29120383. Архів оригіналу за 31 жовтня 2018. Процитовано 7 вересня 2019.
{{cite journal}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Afifi, Mahmoud (12 листопада 2017). Gender recognition and biometric identification using a large dataset of hand images. arXiv:1711.04322 [cs.CV].
- ↑ Lomonaco, Vincenzo; Maltoni, Davide (18 жовтня 2017). CORe50: a New Dataset and Benchmark for Continuous Object Recognition. arXiv:1705.03550 [cs.CV].
- ↑ Morozov, Alexei; Sushkova, Olga (13 червня 2019). THz and thermal video data set. Development of the multi-agent logic programming approach to a human behaviour analysis in a multi-channel video surveillance. Moscow: IRE RAS. Архів оригіналу за 2 вересня 2019. Процитовано 19 липня 2019.
- ↑ Morozov, Alexei; Sushkova, Olga; Kershner, Ivan; Polupanov, Alexander (9 липня 2019). Development of a method of terahertz intelligent video surveillance based on the semantic fusion of terahertz and 3D video images (PDF). CEUR. 2391: paper19. Архів оригіналу (PDF) за 14 липня 2019. Процитовано 19 липня 2019.
- ↑ author., Tecuci, Gheorghe,. Knowledge engineering : building cognitive assistants for evidence-based reasoning. ISBN 978-1-107-12256-7. OCLC 927619906.
- ↑ Frey, Peter W.; Slate, David J. (1991-03). Letter recognition using Holland-style adaptive classifiers. Machine Learning. Т. 6, № 2. с. 161—182. doi:10.1007/bf00114162. ISSN 0885-6125. Процитовано 20 травня 2022.
- ↑ Peltonen, Jaakko; Klami, Arto; Kaski, Samuel (2004-10). Improved learning of Riemannian metrics for exploratory analysis. Neural Networks (англ.). Т. 17, № 8-9. с. 1087—1100. doi:10.1016/j.neunet.2004.06.008. Процитовано 20 травня 2022.
- ↑ Liu, Cheng-Lin; Yin, Fei; Wang, Da-Han; Wang, Qiu-Feng (2013-01). Online and offline handwritten Chinese character recognition: Benchmarking on new databases. Pattern Recognition (англ.). Т. 46, № 1. с. 155—162. doi:10.1016/j.patcog.2012.06.021. Процитовано 20 травня 2022.
- ↑ Wang, Da-Han; Liu, Cheng-Lin; Yu, Jin-Lun; Zhou, Xiang-Dong (2009-07). CASIA-OLHWDB1: A Database of Online Handwritten Chinese Characters. 2009 10th International Conference on Document Analysis and Recognition. с. 1206—1210. doi:10.1109/ICDAR.2009.163. Процитовано 20 травня 2022.
- ↑ Liu, Cheng-Lin; Yin, Fei; Wang, Da-Han; Wang, Qiu-Feng (2013-01). Online and offline handwritten Chinese character recognition: Benchmarking on new databases. Pattern Recognition (англ.). Т. 46, № 1. с. 155—162. doi:10.1016/j.patcog.2012.06.021. Процитовано 20 травня 2022.
- ↑ Williams, Ben H.; Toussaint, Marc; Storkey, Amos J. (2006). Extracting Motion Primitives from Natural Handwriting Data. Artificial Neural Networks – ICANN 2006. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 634—643. ISBN 978-3-540-38871-5.
- ↑ Calif.), IEEE/ACM International Conference on Computer-Aided Design (1998 : San Jose, (1998). 1998 IEEE/ACM International Conference on Computer-Aided Design : digest of technical papers : November 8-12, 1998, San Jose, California. IEEE Computer Society Press. ISBN 1-58113-008-2. OCLC 40434775.
- ↑ V., Cantoni, (1989). Recent issues in pattern analysis and recognition. Springer-Verlag. OCLC 555471615.
- ↑ André, Cohen, Gregory Afshar, Saeed Tapson, Jonathan van Schaik, (17 лютого 2017). EMNIST: an extension of MNIST to handwritten letters. OCLC 1106257270.
- ↑ Cohen, Gregory; Afshar, Saeed; Tapson, Jonathan; van Schaik, André (17 лютого 2017). EMNIST: an extension of MNIST to handwritten letters. arXiv:1702.05373 [cs]. Процитовано 20 травня 2022.
- ↑ Figure 4: Samples of handwritten isolated Arabic characters. dx.doi.org. Процитовано 20 травня 2022.
- ↑ One-Shot Learning Considerations. Internet-Scale Pattern Recognition. Chapman and Hall/CRC. 20 листопада 2012. с. 53—66.
- ↑ Figure 10: Combination the result of feature selection and WGCNA. dx.doi.org. Процитовано 20 травня 2022.
- ↑ editor, Bieger, Jordi., editor Goertzel, Ben., editor Potapov, Alexey.,. Artificial General Intelligence : 8th International Conference, AGI 2015, AGI 2015, Berlin, Germany, July 22-25, 2015, Proceedings. ISBN 3-319-21365-2. OCLC 1113542889.
- ↑ Online), International Conference on Artificial Neural Networks (European Neural Network Society) (30th : 2021 :. Artificial neural networks and machine learning -- ICANN 2021 : 30th International Conference on Artificial Neural Networks, Bratislava, Slovakia, September 14-17, 2021, Proceedings. ISBN 978-3-030-86340-1. OCLC 1268260200.
- ↑ Lecun, Y.; Bottou, L.; Bengio, Y.; Haffner, P. (Nov./1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE. Т. 86, № 11. с. 2278—2324. doi:10.1109/5.726791. Процитовано 20 травня 2022.
- ↑ Kussul, Ernst; Baidyk, Tatiana (2004-10). Improved method of handwritten digit recognition tested on MNIST database. Image and Vision Computing (англ.). Т. 22, № 12. с. 971—981. doi:10.1016/j.imavis.2004.03.008. Процитовано 20 травня 2022.
- ↑ Xu, L.; Krzyzak, A.; Suen, C.Y. (May-June/1992). Methods of combining multiple classifiers and their applications to handwriting recognition. IEEE Transactions on Systems, Man, and Cybernetics. Т. 22, № 3. с. 418—435. doi:10.1109/21.155943. Процитовано 20 травня 2022.
- ↑ Alimoglu, F.; Alpaydin, E. Combining multiple representations and classifiers for pen-based handwritten digit recognition. Proceedings of the Fourth International Conference on Document Analysis and Recognition. IEEE Comput. Soc. doi:10.1109/icdar.1997.620583. Процитовано 20 травня 2022.
- ↑ Tang, E.K.; Suganthan, P.N.; Yao, X.; Qin, A.K. (2005-04). Linear dimensionality reduction using relevance weighted LDA. Pattern Recognition (англ.). Т. 38, № 4. с. 485—493. doi:10.1016/j.patcog.2004.09.005. Процитовано 20 травня 2022.
- ↑ Xu, L.; Krzyzak, A.; Suen, C.Y. (May-June/1992). Methods of combining multiple classifiers and their applications to handwriting recognition. IEEE Transactions on Systems, Man, and Cybernetics. Т. 22, № 3. с. 418—435. doi:10.1109/21.155943. Процитовано 20 травня 2022.
- ↑ Drahan, K. I. (1975). [Endocrinologic peculiarities of the course of pregnancy and labor in primaparous women of the older age groups]. Pediatriia Akusherstvo I Ginekologiia. № 5. с. 41—44. ISSN 0031-4048. PMID 1701. Процитовано 20 травня 2022.
- ↑ Rothschild, M.; Schlein, J.; Parker, K.; Neville, C.; Sternberg, S. (30 жовтня 1975). The jumping mechanism of Xenopsylla cheopis. III. Execution of the jump and activity. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences. Т. 271, № 914. с. 499—515. doi:10.1098/rstb.1975.0064. ISSN 0962-8436. PMID 1806. Процитовано 20 травня 2022.
- ↑ Liu, Qun; Collier, Edward; Mukhopadhyay, Supratik (2019). Jatowt, Adam; Maeda, Akira; Syn, Sue Yeon (ред.). PCGAN-CHAR: Progressively Trained Classifier Generative Adversarial Networks for Classification of Noisy Handwritten Bangla Characters. Digital Libraries at the Crossroads of Digital Information for the Future (англ.). Т. 11853. Cham: Springer International Publishing. с. 3—15. doi:10.1007/978-3-030-34058-2_1. ISBN 978-3-030-34057-5.
- ↑ iSAID. captain-whu.github.io. Процитовано 20 травня 2022.
- ↑ Butenuth, Matthias; Burkert, Florian; Schmidt, Florian; Hinz, Stefan; Hartmann, Dirk; Kneidl, Angelika; Borrmann, Andre; Sirmacek, Beril (2011-11). Integrating pedestrian simulation, tracking and event detection for crowd analysis. 2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops). IEEE. doi:10.1109/iccvw.2011.6130237. Процитовано 20 травня 2022.
- ↑ India), CIPR (Conference) (1st : 2019 : Sibpur,. Computational intelligence in pattern recognition : proceedings of CIPR 2019. ISBN 978-981-13-9042-5. OCLC 1113880051.
- ↑ Butenuth, Matthias; Burkert, Florian; Schmidt, Florian; Hinz, Stefan; Hartmann, Dirk; Kneidl, Angelika; Borrmann, Andre; Sirmacek, Beril (2011-11). Integrating pedestrian simulation, tracking and event detection for crowd analysis. 2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops). IEEE. doi:10.1109/iccvw.2011.6130237. Процитовано 20 травня 2022.
- ↑ Fradi, Hajer; Dugelay, Jean-Luc (2012-12). Low level crowd analysis using frame-wise normalized feature for people counting. 2012 IEEE International Workshop on Information Forensics and Security (WIFS). IEEE. doi:10.1109/wifs.2012.6412657. Процитовано 20 травня 2022.
- ↑ Johnson, Brian Alan; Tateishi, Ryutaro; Hoan, Nguyen Thanh (27 червня 2013). A hybrid pansharpening approach and multiscale object-based image analysis for mapping diseased pine and oak trees. International Journal of Remote Sensing. Т. 34, № 20. с. 6969—6982. doi:10.1080/01431161.2013.810825. ISSN 0143-1161. Процитовано 20 травня 2022.
- ↑ Mohd Pozi, Muhammad Syafiq; Sulaiman, Md Nasir; Mustapha, Norwati; Perumal, Thinagaran (3 липня 2015). A new classification model for a class imbalanced data set using genetic programming and support vector machines: case study for wilt disease classification. Remote Sensing Letters (англ.). Т. 6, № 7. с. 568—577. doi:10.1080/2150704X.2015.1062159. ISSN 2150-704X. Процитовано 20 травня 2022.
- ↑ China), International Conference on Digital Image Processing (8th : 2016 : Chengdu,. Eighth International Conference on Digital Image Processing (ICDIP 2016) : 20-23 May 2016, Chengdu, China. ISBN 1-5106-0504-5. OCLC 971084912.
- ↑ Gallego, Antonio-Javier. MASATI dataset - MAritime SATellite Imagery dataset. www.iuii.ua.es (англ.). Процитовано 20 травня 2022.
- ↑ Gallego, Antonio-Javier; Pertusa, Antonio; Gil, Pablo (24 березня 2018). Automatic Ship Classification from Optical Aerial Images with Convolutional Neural Networks. Remote Sensing. Т. 10, № 4. с. 511. doi:10.3390/rs10040511. ISSN 2072-4292. Процитовано 20 травня 2022.
{{cite news}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання) - ↑ Chatterjee, Sankhadeep; Ghosh, Subhodeep; Dawn, Subham; Hore, Sirshendu; Dey, Nilanjan (2016). Forest Type Classification: A Hybrid NN-GA Model Based Approach. Advances in Intelligent Systems and Computing. New Delhi: Springer India. с. 227—236. ISBN 978-81-322-2756-4.
- ↑ Diegert, Carl (2010-10). A combinatorial method for tracing objects using semantics of their shape. 2010 IEEE 39th Applied Imagery Pattern Recognition Workshop (AIPR). IEEE. doi:10.1109/aipr.2010.5759716. Процитовано 20 травня 2022.
- ↑ Frédéric, Razakarivony, Sebastien Jurie,. Small Target Detection combining Foreground and Background Manifolds. OCLC 877840527.
- ↑ Ilijason, Robert (2021). Getting Started with Databricks. Getting Started with Databricks. Berkeley, CA: Apress. ISBN 978-1-4842-6919-0.
- ↑ Vakalopoulou, Maria; Bus, Norbert; Karantzalos, Konstantinos; Paragios, Nikos (2017-07). Integrating edge/boundary priors with classification scores for building detection in very high resolution data. 2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). IEEE. с. 3309—3312. doi:10.1109/IGARSS.2017.8127705. ISBN 978-1-5090-4951-6. Процитовано 20 травня 2022.
- ↑ Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (3 листопада 2015). DeepSat: a learning framework for satellite imagery. Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems (англ.). ACM. с. 1—10. doi:10.1145/2820783.2820816. ISBN 978-1-4503-3967-4. Процитовано 20 травня 2022.
- ↑ Liu, Qun; Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (1 лютого 2020). DeepSat V2: feature augmented convolutional neural nets for satellite image classification. Remote Sensing Letters. Т. 11, № 2. с. 156—165. doi:10.1080/2150704X.2019.1693071. ISSN 2150-704X. Процитовано 20 травня 2022.
- ↑ Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (3 листопада 2015). DeepSat: a learning framework for satellite imagery. Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems (англ.). ACM. с. 1—10. doi:10.1145/2820783.2820816. ISBN 978-1-4503-3967-4. Процитовано 20 травня 2022.
- ↑ Liu, Qun; Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (1 лютого 2020). DeepSat V2: feature augmented convolutional neural nets for satellite image classification. Remote Sensing Letters (англ.). Т. 11, № 2. с. 156—165. doi:10.1080/2150704X.2019.1693071. ISSN 2150-704X. Процитовано 20 травня 2022.
- ↑ Harken, A. H.; Woods, M. (1976-02). The influence of oxyhemoglobin affinity on tissue oxygen consumption. Annals of Surgery. Т. 183, № 2. с. 130—135. doi:10.1097/00000658-197602000-00008. ISSN 0003-4932. PMC 1344074. PMID 2111. Процитовано 20 травня 2022.
- ↑ Ebadi, Ashkan; Paul, Patrick; Auer, Sofia; Tremblay, Stéphane (19 листопада 2021), The gas meter image dataset (NRC-GAMMA) (англ.), National Research Council of Canada, doi:10.4224/3c8s-z290, процитовано 20 травня 2022
- ↑ Rabah, Chaima Ben; Coatrieux, Gouenou; Abdelfattah, Riadh (2020-10). The Supatlantique Scanned Documents Database for Digital Image Forensics Purposes. 2020 IEEE International Conference on Image Processing (ICIP). IEEE. doi:10.1109/icip40778.2020.9190665. Процитовано 20 травня 2022.
- ↑ Mills, Kyle; Tamblyn, Isaac (12 березня 2019), Big graphene dataset (англ.), National Research Council of Canada, doi:10.4224/c8sc04578j.data, процитовано 20 травня 2022
- ↑ Mills, Kyle; Tamblyn, Isaac (12 березня 2019), Big graphene dataset (англ.), National Research Council of Canada, doi:10.4224/c8sc04578j.data, процитовано 20 травня 2022
- ↑ Mills, Kyle; Spanner, Michael; Tamblyn, Isaac (18 травня 2018), Quantum simulations of an electron in a two dimensional potential well (англ.), National Research Council of Canada, doi:10.4224/physreva.96.042113.data, процитовано 20 травня 2022
- ↑ Rohrbach, Marcus; Amin, Sikandar; Andriluka, Mykhaylo; Schiele, Bernt (2012-06). A database for fine grained activity detection of cooking activities. 2012 IEEE Conference on Computer Vision and Pattern Recognition. с. 1194—1201. doi:10.1109/CVPR.2012.6247801. Процитовано 20 травня 2022.
- ↑ Kuehne, Hilde; Arslan, Ali; Serre, Thomas (2014-06). The Language of Actions: Recovering the Syntax and Semantics of Goal-Directed Human Activities. 2014 IEEE Conference on Computer Vision and Pattern Recognition. IEEE. doi:10.1109/cvpr.2014.105. Процитовано 20 травня 2022.
- ↑ Rohrbach, Marcus; Amin, Sikandar; Andriluka, Mykhaylo; Schiele, Bernt (2012-06). A database for fine grained activity detection of cooking activities. 2012 IEEE Conference on Computer Vision and Pattern Recognition. с. 1194—1201. doi:10.1109/CVPR.2012.6247801. Процитовано 20 травня 2022.
- ↑ Taran, O.; Rezaeifar, S.; Dabrowski, O.; Schlechten, J.; Holotyak, T.; Voloshynovskiy, S. (2017-08). PharmaPack: Mobile fine-grained recognition of pharma packages. 2017 25th European Signal Processing Conference (EUSIPCO). IEEE. doi:10.23919/eusipco.2017.8081543. Процитовано 20 травня 2022.
- ↑ Xiang, Li, Pu Li, Xiangyang Long, (14 червня 2020). FenceMask: A Data Augmentation Approach for Pre-extracted Image Features. OCLC 1228414137.
- ↑ Diagnosis. Seizures in Dogs and Cats. Hoboken, NJ: John Wiley & Sons, Inc. 1 травня 2015. с. 94—128. ISBN 978-1-118-68969-1.
- ↑ Biggs, Benjamin; Boyne, Oliver; Charles, James; Fitzgibbon, Andrew; Cipolla, Roberto (2020). Who Left the Dogs Out? 3D Animal Reconstruction with Expectation Maximization in the Loop. Computer Vision – ECCV 2020. Cham: Springer International Publishing. с. 195—211. ISBN 978-3-030-58620-1.
- ↑ Stefan, Sharif Razavian, Ali Azizpour, Hossein Sullivan, Josephine Carlsson, (2014). CNN features off-the-shelf : An Astounding Baseline for Recognition. KTH, Datorseende och robotik, CVAP. OCLC 1233686320.
- ↑ Diagnosis. Seizures in Dogs and Cats. Hoboken, NJ: John Wiley & Sons, Inc. 1 травня 2015. с. 94—128. ISBN 978-1-118-68969-1.
- ↑ Ortega, M.; Rui, Y.; Chakrabarti, K.; Porkaew, K.; Mehrotra, S.; Huang, T.S. (Nov.-Dec./1998). Supporting ranked Boolean similarity queries in MARS. IEEE Transactions on Knowledge and Data Engineering. Т. 10, № 6. с. 905—925. doi:10.1109/69.738357. Процитовано 20 травня 2022.
- ↑ France), International Conference on Medical Image Computing and Computer-Assisted Intervention (15th : 2012 : Nice, (2012). Medical image computing and computer-assisted intervention--MICCAI 2012. 15th International Conference, Nice, France, October 1-5, 2012, Proceedings. Springer. ISBN 978-3-642-33418-4. OCLC 811773023.
- ↑ Deneke, Tewodors; Haile, Habtegebreil; Lafond, Sebastien; Lilius, Johan (2014-07). Video transcoding time prediction for proactive load balancing. 2014 IEEE International Conference on Multimedia and Expo (ICME). IEEE. doi:10.1109/icme.2014.6890256. Процитовано 20 травня 2022.
- ↑ 10.3726/978-3-653-03968-9/3. Inactive DOIs. CrossRef.
- ↑ Supplemental Information 1: Datase 1 http://dx.doi.org/10.7287/peerj.preprints.27138/supp-1. Процитовано 20 травня 2022.
{{cite web}}
: Пропущений або порожній|title=
(довідка) - ↑ author., Barnard, Kobus.,. Computational methods for integrating vision and language. ISBN 1-60845-113-5. OCLC 1127139088.
- ↑ Shin, Kwangsoo; Jeon, Junhyeong; Lee, Seungbin; Lim, Boyoung; Jeong, Minsoo; Nang, Jongho (2019). Approach for Video Classification with Multi-label on YouTube-8M Dataset. Lecture Notes in Computer Science. Cham: Springer International Publishing. с. 317—324. ISBN 978-3-030-11017-8.
- ↑ Fisher, Justin; Kil, Hyunyoung; Lee, Dongwon (2006). OpenArXiv = arXiv + RDBMS + web services. Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries - JCDL '06. ACM Press. doi:10.1145/1141753.1141870. Процитовано 20 травня 2022.
- ↑ Matthieu., Deru, (2020). Deep Learning mit TensorFlow, Keras und TensorFlow.js. Rheinwerk Verlag. ISBN 978-3-8362-7427-2. OCLC 1204141741.
- ↑ Thomee, Bart; Shamma, David A.; Friedland, Gerald; Elizalde, Benjamin; Ni, Karl; Poland, Douglas; Borth, Damian; Li, Li-Jia (25 січня 2016). YFCC100M: the new data in multimedia research. Communications of the ACM (англ.). Т. 59, № 2. с. 64—73. doi:10.1145/2812802. ISSN 0001-0782. Процитовано 20 травня 2022.
- ↑ Baveye, Yoann; Dellandrea, Emmanuel; Chamaret, Christel; Liming Chen (1 січня 2015). LIRIS-ACCEDE: A Video Database for Affective Content Analysis. IEEE Transactions on Affective Computing. Т. 6, № 1. с. 43—55. doi:10.1109/taffc.2015.2396531. ISSN 1949-3045. Процитовано 20 травня 2022.
- ↑ Baveye, Yoann; Dellandrea, Emmanuel; Chamaret, Christel; Chen, Liming (2015-09). Deep learning vs. kernel methods: Performance for emotion prediction in videos. 2015 International Conference on Affective Computing and Intelligent Interaction (ACII). IEEE. doi:10.1109/acii.2015.7344554. Процитовано 20 травня 2022.
- ↑ Zhang, Xiaotong; Cheng, Xingliang; Xu, Mingxing; Zheng, Thomas Fang (2 вересня 2018). Imbalance Learning-based Framework for Fear Recognition in the MediaEval Emotional Impact of Movies Task. Interspeech 2018. ISCA. doi:10.21437/interspeech.2018-1744. Процитовано 20 травня 2022.
- ↑ Johnson, Sam; Everingham, Mark (2010). Clustered Pose and Nonlinear Appearance Models for Human Pose Estimation. Procedings of the British Machine Vision Conference 2010. British Machine Vision Association. doi:10.5244/c.24.12. Процитовано 20 травня 2022.
- ↑ Johnson, Sam; Everingham, Mark (2011-06). Learning effective human pose estimation from inaccurate annotation. CVPR 2011. IEEE. doi:10.1109/cvpr.2011.5995318. Процитовано 20 травня 2022.
- ↑ Reports of six individual workshops. Nursing Mirror and Midwives Journal. Т. 142, № 2. 8 січня 1976. с. 56—59. ISSN 0143-2524. PMID 1711. Процитовано 20 травня 2022.
- ↑ Eduard, Jauhar, Sujay Kumar Turney, Peter Hovy, (11 лютого 2016). TabMCQ: A Dataset of General Knowledge Tables and Multiple-choice Questions. OCLC 1106232721.
- ↑ Taj-Eddin, Islam A.T.F.; Afifi, Mahmoud; Korashy, Mostafa; Hamdy, Doha; Nasser, Marwa; Derbaz, Shimaa (2016-07). A new compression technique for surveillance videos: Evaluation using new dataset. 2016 Sixth International Conference on Digital Information and Communication Technology and its Applications (DICTAP). IEEE. с. 159—164. doi:10.1109/DICTAP.2016.7544020. ISBN 978-1-4673-9609-7. Процитовано 20 травня 2022.
- ↑ Tabak, Michael A.; Norouzzadeh, Mohammad S.; Wolfson, David W.; Sweeney, Steven J.; Vercauteren, Kurt C.; Snow, Nathan P.; Halseth, Joseph M.; Di Salvo, Paul A.; Lewis, Jesse S. (2019-04). Photopoulou, Theoni (ред.). Machine learning to classify animal species in camera trap images: Applications in ecology. Methods in Ecology and Evolution (англ.). Т. 10, № 4. с. 585—590. doi:10.1111/2041-210X.13120. ISSN 2041-210X. Процитовано 20 травня 2022.
- ↑ Taj-Eddin, Islam A. T. F. (2 листопада 2017). Can we see photosynthesis? Magnifying the tiny color changes of plant green leaves using Eulerian video magnification. Journal of Electronic Imaging. Т. 26, № 06. с. 1. doi:10.1117/1.JEI.26.6.060501. ISSN 1017-9909. Процитовано 20 травня 2022.
- ↑ author., Danesi, Marcel, 1946-. An anthropology of puzzles : the role of puzzles in the origins and evolution of mind and culture. ISBN 978-1-350-08985-3. OCLC 1043395986.
- ↑ den, McAuley, Julian Targett, Christopher Shi, Qinfeng Hengel, Anton van (15 червня 2015). Image-based Recommendations on Styles and Substitutes. OCLC 1106220231.
- ↑ author., Cantarella, Cara,. TEAS review. ISBN 978-1-260-46239-5. OCLC 1140410786.
- ↑ Ganesan, Kavita; Zhai, ChengXiang (2012-04). Opinion-based entity ranking. Information Retrieval (англ.). Т. 15, № 2. с. 116—150. doi:10.1007/s10791-011-9174-8. ISSN 1386-4564. Процитовано 20 травня 2022.
- ↑ China), ICSI (Conference) (4th : 2013 : Harbin,. Advances in swarm intelligence : 4th International Conference, ICSI 2013, Harbin, China, June 12-15, 2013, proceedings. ISBN 978-3-642-38702-9. OCLC 851389904.
- ↑ Harper, F. Maxwell; Konstan, Joseph A. (7 січня 2016). The MovieLens Datasets: History and Context. ACM Transactions on Interactive Intelligent Systems (англ.). Т. 5, № 4. с. 1—19. doi:10.1145/2827872. ISSN 2160-6455. Процитовано 20 травня 2022.
- ↑ Koenigstein, Noam; Dror, Gideon; Koren, Yehuda (2011). Yahoo! music recommendations. Proceedings of the fifth ACM conference on Recommender systems - RecSys '11. ACM Press. doi:10.1145/2043932.2043964. Процитовано 20 травня 2022.
- ↑ Dezhao., Song, (2014). Towards a linked semantic web: Precisely, comprehensively and scalably linking heterogeneous data in the semantic web. ISBN 978-1-303-66041-2. OCLC 875517979.
- ↑ Tan, Peter J.; Dowe, David L. (2002). MML Inference of Decision Graphs with Multi-way Joins. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 131—142. ISBN 978-3-540-00197-3.
- ↑ Schneebeli, Célia (23 грудня 2020). Where lol Is: Function and Position of lol Used as a Discourse Marker in YouTube Comments. Discours. № 27. doi:10.4000/discours.10900. ISSN 1963-1723. Процитовано 20 травня 2022.
- ↑ Kim, Byung Joo (2012). Lee, Geuk; Howard, Daniel; Ślęzak, Dominik; Hong, You Sik (ред.). A Classifier for Big Data. Convergence and Hybrid Information Technology (англ.). Т. 310. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 505—512. doi:10.1007/978-3-642-32692-9_63. ISBN 978-3-642-32691-2.
- ↑ D., Pérezgonzález, Jose. Predicting Skytrax airport rankings from customer reviews. OCLC 754949191.
- ↑ 1959-, Kuncheva, Ludmila I. (Ludmila Ilieva),. Combining pattern classifiers : methods and algorithms. ISBN 978-1-118-91454-0. OCLC 878051089.
|