|
Внимание, важное сообщение: Дорогие Друзья!
В ноябре далекого 2001 года мы решили создать сайт и форум, которые смогут помочь как начинающим, так и продвинутым пользователям разобраться в операционных системах. В 2004-2006г наш проект был одним из самых крупных ИТ ресурсов в рунете, на пике нас посещало более 300 000 человек в день! Наша документация по службам Windows и автоматической установке помогла огромному количеству пользователей и сисадминов. Мы с уверенностью можем сказать, что внесли большой вклад в развитие ИТ сообщества рунета. Но... время меняются, приоритеты тоже. И, к сожалению, пришло время сказать До встречи! После долгих дискуссий было принято решение закрыть наш проект. 1 августа форум переводится в режим Только чтение, а в начале сентября мы переведем рубильник в положение Выключен Огромное спасибо за эти 24 года, это было незабываемое приключение. Сказать спасибо и поделиться своей историей можно в данной теме. С уважением, ваш призрачный админ, BigMac... |
|
| Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2013 - Анализ текста |
|
|
2013 - Анализ текста
|
|
Старожил Сообщения: 241 |
Всем привет.
Можете подсказать, можно в Word производить такой анализ текста: разбить текст на слова, посчитать количество повторяющихся слов в тексте, найти пары слов наиболее связанных друг с другом и посчитать их количество? |
|
|
Отправлено: 23:28, 07-10-2015 |
|
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать Цитата Invincible:
Цитата Invincible:
Если «союзы, предлоги, частицы удалить из текста» ещё возможно теоретически (если Вы перечислите все возможные варианты «союзы, предлоги, частицы»), то конкурировать с десятками и сотнями тысяч человеко-лет крупных контор в лексическом анализе нереально. |
||
|
Отправлено: 20:45, 10-10-2015 | #11 |
|
Будем жить, Маэстро... Сообщения: 6694
|
Профиль | Сайт | Отправить PM | Цитировать Цитата Invincible:
|
|
|
------- Отправлено: 01:07, 11-10-2015 | #12 |
|
Старожил Сообщения: 241
|
Профиль | Отправить PM | Цитировать Option Explicit
Sub Sample()
Dim objWord As Range
Dim strWord As String
Dim objDictionary As Object
Dim elem As Variant
Dim strWord1 As String
Dim strWord2 As String
Dim i As Integer
Set objDictionary = CreateObject("Scripting.Dictionary")
For Each objWord In ThisDocument.Words
strWord = RemoveNonAlpha(objWord.Text)
If Not Len(strWord) = 0 Then
If Not objDictionary.Exists(strWord) Then
objDictionary.Add strWord, 1
Else
objDictionary.Item(strWord) = objDictionary.Item(strWord) + 1
End If
End If
Next
For Each elem In objDictionary.Keys
Debug.Print "[" & elem & "]", objDictionary.Item(elem)
Next
objDictionary.RemoveAll
Debug.Print "===================================================================="
For i = 1 To ThisDocument.Words.Count - 1
strWord1 = LCase(RemoveNonAlpha(ThisDocument.Words.Item(i).Text))
strWord2 = LCase(RemoveNonAlpha(ThisDocument.Words.Item(i + 1).Text))
If Len(strWord1) > 0 And Len(strWord2) > 0 Then
If StrComp(strWord1, strWord2, vbTextCompare) = 1 Then
strWord = strWord2 & " " & strWord1
Else
strWord = strWord1 & " " & strWord2
End If
If Not objDictionary.Exists(strWord) Then
objDictionary.Add strWord, 1
Else
objDictionary.Item(strWord) = objDictionary.Item(strWord) + 1
End If
End If
Next
For Each elem In objDictionary.Keys
Debug.Print "[" & elem & "]", objDictionary.Item(elem)
Next
objDictionary.RemoveAll
Set objDictionary = Nothing
End Sub
Function RemoveNonAlpha(strValue As String) As String
With CreateObject("VBScript.RegExp")
.IgnoreCase = True
.Global = True
.Multiline = True
.Pattern = "([^a-zа-яё])*"
RemoveNonAlpha = .Replace(strValue, "")
End With
End Function
|
|
Отправлено: 00:56, 16-10-2015 | #13 |
|
|
Участник сейчас на форуме |
|
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
| Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
| F-Анализ 1.0 | OSZone Software | Новости программного обеспечения | 0 | 02-09-2015 16:30 | |
| CMD/BAT - [решено] Анализ лог файла с изменением текста. | Kainos | Скриптовые языки администрирования Windows | 2 | 18-04-2015 01:49 | |
| Договора и анализ 1.0 | OSZone Software | Новости программного обеспечения | 0 | 27-03-2010 09:30 | |
| MSFT SQL Server - анализ dm_os_wait_stats | eboue | Программирование и базы данных | 0 | 03-04-2009 20:05 | |
| [решено] Какая разница между "Сигнатурный анализ" и "Эвристический анализ"? | verdix | Хочу все знать | 3 | 10-11-2008 23:50 | |
|