Return to article

Семантические кластеры патентных документов и генератор наборов данных для машинного обучения

Таблица 3 - Распределение кластеров по количеству входящих в них документов

​Количество документов в кластере

​Количество кластеров всего

​Количество кластеров с базовым А1

​Количество кластеров с базовым В2

​1

​1451135

​1448591

​2544

​2

2618526

2514177

104349​

​3

​1547495

​1272907

​274588

​4

697023​

552380

​144643

​5

531856​

​366779

​165077

​6

​477485

306253

171232

​7

​322675

​169381

​153294

​8

​309819

​159317

​150502

​9

​268019

​125349

​142670

​10

​232084

​99400

​132684

​11

​212799

​88227

​124572

​12

​193804

​77536

​116628

​13

​173542

65813

​107729

​14

​160379

59407

​100972

​15

147284​

​53446

​93838

​16

​134933

47430​

87503​

17​

​126767

44328​

82439​

18​

​117083

40296​

76787​

​19

​106825

​36324

​70501

​20

​100118

33868​

66250​

​21

​94470

​31688

​62782

​22

​88077

29019​

59058​

​23

​82152

27495​

54657​

​24

​77162

​25225

​51937

​25

​72079

​23621

48458​

26​

​68448

22128​

46320​

27​

​64676

​20934

​43742

​28

​60762

​19581

​41181

​29

​57694

18708​

​38986

​30

...

100

​54741

...

5720

​17824

...

1654

​36917

...

4066