Поиск одинаковых предложений
Поиск одинаковых предложений!
Насколько я знаю, специальных стандартных средств в Word для выполнения поставленной вами задачи не имеется.
Решение ее для общего случая — очень сложно. Нужно выделять отдельные предложения (в абзаце может быть несколько предложений) и сравнивать каждое предложение со всеми остальными.
В частном случае — если каждый абзац состоит из одного предложения, можно поступить следующим образом:
— Выделить все;
— Выполнить сортировку абзацев (в Word 2010 это: Главная — группа Абзац — Сортировка) (чаще всего, такая сортировка производится достаточно корректно, но, обратите внимание, что первая строка выделения обычно считается заголовком и не сортируется).
— Сравнить абзацы вручную (это будет уже проще, так как абзацы будут отсортированы, и одинаковые абзацы будут находиться рядом).
К сожалению, я больше ничем вам помочь не смогу.
3 Ответ от Hans 16.01.2013 11:07:56
- Hans
- рядовой
- Неактивен
- Зарегистрирован: 15.01.2013
- Сообщений: 7
Re: Поиск одинаковых предложений!
Вот бы кто макрос написал или кто знает что такой макрос уже написан и ссылку скинул..
Насколько я знаю, специальных стандартных средств в Word для выполнения поставленной вами задачи не имеется.
Решение ее для общего случая — очень сложно. Нужно выделять отдельные предложения (в абзаце может быть несколько предложений) и сравнивать каждое предложение со всеми остальными.В частном случае — если каждый абзац состоит из одного предложения, можно поступить следующим образом:
— Выделить все;
— Выполнить сортировку абзацев (в Word 2010 это: Главная — группа Абзац — Сортировка) (чаще всего, такая сортировка производится достаточно корректно, но, обратите внимание, что первая строка выделения обычно считается заголовком и не сортируется).
— Сравнить абзацы вручную (это будет уже проще, так как абзацы будут отсортированы, и одинаковые абзацы будут находиться рядом).К сожалению, я больше ничем вам помочь не смогу.
Сообщений [ 3 ]
Страницы 1
Чтобы отправить ответ, вы должны войти или зарегистрироваться
Похожие темы
Поиск одинаковых предложений!
Microsoft Word – приложение, которое значительно облегчило нашу жизнь. Сейчас трудно представить себе написание и редактирование текста без помощи Ворда. На портале о Microsoft Office Word вы узнаете про: лицензионный ключ для активации microsoft office 2007. Это не просто очень мощный, удобный, интуитивно понятный редактор, это еще и инструмент, позволяющий пользователю в полной мере проявить свою фантазию, настраивая работу программы в соответствии с теми функциями, которые наиболее важны в данный момент. На портале о Microsoft Office Word вы узнаете про: стили форматирование word.
Более полно пользоваться всеми функциями и возможностями приложения научат вас на форуме Ворд Эксперт. На портале о Microsoft Office Word вы узнаете про: 25 значный ключ для ворд 2007. На этом ресурсе в удобной форме собрана вся информация по Ворду. Форум состоит из основного раздела, в котором вы найдете инструкции по написанию макросов и шаблонов, ответы на самые распространенные вопросы, обсуждение различных настроек всех версий Ворда, а также различных способов и проблем редактирования и форматирования текстов в Ворде. На портале о Microsoft Office Word вы узнаете про: как в экселе написать дробь. В этом же разделе вы можете поделиться своими или просмотреть предложенные готовые решения различных задач. На портале о Microsoft Office Word вы узнаете про: как вставить символі игральніх карт в word. Например, макрос для автоформата таблиц, оптимизация работы с «горячими клавишами» и прочее.
Кроме этого, на форуме существует раздел, в котором можно описать свою проблему и оставить заявку на ее решение, а также подфорум для свободного общения. Наш сайт о Microsoft Office Word даст ответ про: символ в word телефон.
Выделите (не удаляйте) повторяющиеся предложения или фразы
У меня складывается впечатление, что это невозможно в word, но я думаю, что если вы ищете любые 3-4 слов, которые идут в одной и той же последовательности в любом месте очень длинной статьи, я мог бы найти дубликаты одних и тех же фраз.
Я скопировал и вставил много документации из прошлых работ и надеялся найти простой способ найти любую повторяющуюся информацию в этом 40-страничном документе есть много различных форматирований, но я был бы готов временно избавиться от форматирования, чтобы найти повторяющуюся информацию.
3 ответа
- повторяющиеся фразы в тексте Python
У меня есть проблема, и я понятия не имею, как ее решить. Пожалуйста, дайте совет. У меня есть сообщение. Большой, большой текст. Задача состоит в том, чтобы найти все повторяющиеся фразы, длина которых равна 3(содержат три слова) в тексте.
Я пытаюсь найти эффективный способ поиска повторяющихся фраз в большой строке. Строка будет содержать сотни или тысячи слов, разделенных пустым пробелом. Я включил ниже код, который в настоящее время использую, но он очень неэффективен в поиске повторяющихся фраз. public static string.
Чтобы выделить все повторяющиеся предложения, вы также можете использовать ActiveDocument.Sentences(i) . Вот пример
LOGIC
1) Соберите все предложения из документа word в массив
2) Сортировка массива
3) Извлечение Дубликатов
4) Выделите дубликаты
CODE
SNAPSHOTS
BEFORE
AFTER
Я не использовал свое собственное предложение DAWG, и мне все еще интересно посмотреть, есть ли у кого-то еще способ сделать это, но я смог придумать это:
Я проверил это на 258-страничном документе ( TheStory.txt ) из этого источника , и он был запущен всего за несколько минут.
См. Раздел test() для использования.
Вам нужно будет ссылаться на среду выполнения сценариев Microsoft, чтобы использовать объекты Scripting.Dictionary . Если это нежелательно, можно внести небольшие изменения, чтобы вместо этого использовать Collections , но я предпочитаю Dictionary , поскольку у него есть полезный метод .Exists() .
- Повторяющиеся фразы в тексте Python _ Последующие действия
Другой пользователь уже открыл дискуссию о том, как найти повторяющиеся фразы в Python, но сосредоточился только на фразах из трех слов. Ответ Роберта Россни был полным и рабочим (именно здесь повторяются фразы в тексте Python ), но могу ли я попросить метод, который просто находит повторяющиеся.
Допустим, у меня есть массив: [ I want **a dog**, **A dog** is here, Pet **a dog**, A **red cat**, **red cat** is cute . ] Как мне выяснить, что представляют собой повторяющиеся фразы , а не просто слова? Например, я хотел бы, чтобы собака и рыжий кот были возвращены. Большинство.
Я выбрал довольно хромую теорию, но, похоже, она работает (по крайней мере, если я правильно понял вопрос, потому что иногда я медленно понимаю). Я загружаю весь текст в строку, загружаю отдельные слова в массив, перебираю массив и объединяю строку, содержащую каждый раз три последовательных слова.
Поскольку результаты уже включены в 3 группы слов, 4 группы слов или более будут автоматически распознаны.
Код предполагает непрерывный текст без маркированных точек.
Похожие вопросы:
Я новичок, когда дело доходит до VBA, Macros и модулей, поэтому, пожалуйста, включите конкретные шаги. Как удалить повторяющиеся фразы из одной ячейки, например следующие: Brotherhood Of Man -.
Итак, у меня есть около 1000 дублированных фраз в этом файле, так что делать это вручную не вариант. Обратите внимание, что это PHRASES, а не строки или слова, и каждый phrase имеет длину около 10.
Есть ли простой способ удалить дубликаты содержимого из большого текстового файла? Было бы здорово иметь возможность обнаруживать повторяющиеся предложения (разделенные знаком.) или еще лучше.
У меня есть проблема, и я понятия не имею, как ее решить. Пожалуйста, дайте совет. У меня есть сообщение. Большой, большой текст. Задача состоит в том, чтобы найти все повторяющиеся фразы, длина.
Я пытаюсь найти эффективный способ поиска повторяющихся фраз в большой строке. Строка будет содержать сотни или тысячи слов, разделенных пустым пробелом. Я включил ниже код, который в настоящее.
Другой пользователь уже открыл дискуссию о том, как найти повторяющиеся фразы в Python, но сосредоточился только на фразах из трех слов. Ответ Роберта Россни был полным и рабочим (именно здесь.
Допустим, у меня есть массив: [ I want **a dog**, **A dog** is here, Pet **a dog**, A **red cat**, **red cat** is cute . ] Как мне выяснить, что представляют собой повторяющиеся фразы , а не.
Предположим, у меня есть строка, такая как ‘I hate *some* kinds of duplicate. This string has a duplicate phrase, duplicate phrase.’ Я хочу удалить второе вхождение duplicate phrase , не удаляя.
Я работаю со строковой переменной response в Stata. Эта переменная хранит полные предложения, и многие из этих предложений имеют повторяющиеся фразы. Например: how do you know how do you know what.
У меня есть строка, в которой есть повторяющиеся фразы, или это может быть даже одно слово, которое встречается несколько раз подряд. Пробовал различные методы, но не смог найти лучшего подхода.
Как удалить повторяющиеся строки и абзацы в Word
Как и говорил в посте Как найти и заменить текст в Ms Office Word, Open Office Writer, Libre Office, сегодня попробуем поработать с большим количеством информации. Бывает, что из массива текста нужно удалить повторяющиеся строки и абзацы. Будем оставлять самое главное и удалять лишнее в очень большом тексте в Word.
Как удалить повторяющиеся строки и абзацы Word
Текст, который мы будем «чистить»:
Итак, удаляем строки, которые выделены жирным и оставляем только нужный текст.
Обратите внимание, что длина удаляемого текста отличается. Для выделения строки независимо от количества символов нажимаем Ctrl+Shift+стрелка вниз. Под спойлером в конце поста вы увидите все команды выделения текста с помощью клавиатуры. А сейчас переводим курсор в начало текста, переходим в меню «Макросы» и включаем запись макроса.
Как записать макрос
Когда будете задавать имя макросу, не оставляйте пробелы – Word выдаст ошибку. Назначаем его для кнопки или клавиатуры. Я больше люблю работать с клавиатурой и выбрал поэтому клавиши.
Настраиваем макрос. Тут просто нажимаем любое сочетание клавиш. Если оно уже присвоено, то об этом появится информация.
Я присвоил макросу клавиатурную комбинацию Ctrl+G. Эта комбинация не используется в стандартном режиме редактирования и является свободной. Не переписывайте комбинации, которые часто используете .
Запомнили число и нажали Ctrl+Z – отменили замену текста на звёздочку. Теперь я знаю, что в примере у меня 24 вхождения. Это я должен нажать 24 раза сочетание Ctrl+G для того, чтобы отформатировать текст. Будем упрощать это дело.
Нажимаем Alt+ F 11. Мы попали в редактор макросов. Это большая и сложная тема, тут самый настоящий язык программирования, но у нас всё будет просто, я вас уверяю.
Вписываем как на картинке две строки в начало и слово в конце.
Dim i As Integer
For i = 0 To 23
Что это значит? Мы обозначили i — числовой переменной и присвоили значения от 0 до 23, после окончания первого цикла замены число i увеличится на 1 и макрос будет снова повторяться (Next) до тех пор, пока не достигнет конца (23).
То есть эти строки дают команду после нажатия Ctrl+G повторить макрос «Удаляем3строки» 23 раза. Вот текст моего примера макроса.
Пример макроса для удаления трёх строк
Dim i As Integer
Selection.MoveDown Unit:=wdLine, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.MoveDown Unit:=wdParagraph, Count:=1, Extend:=wdExtend
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.MoveDown Unit:=wdLine, Count:=1
Сохраняем макрос и закрываем редактор.
Обратите внимание, что после того, как мы перенесём пятую строку к первой, текст может вылезать на другую строку и макрос будет дальше работать неправильно.
Тогда можно временно заменить регулярное выражение на любой символ или уменьшить шрифт на этапе работы макроса и тому подобное.
Вернулись в редактор, нажали Ctrl+G, и текст мигом принял новый вид. Всё получилось. За пару минут обработали довольно большой текст в автоматическом режиме.
Команды управления для макросов
Выделение текста с помощью клавиатуры.Выделение элементов в основном тексте документа
Выделяемый элемент | Действие |
Один знак вправо | Нажмите клавиши SHIFT+СТРЕЛКА ВПРАВО |
Один знак влево | Нажмите клавиши SHIFT+СТРЕЛКА ВЛЕВО |
Слово от начала к концу | Установите курсор в начало слова и нажмите клавиши CTRL+SHIFT+СТРЕЛКА ВПРАВО. |
Слово от конца к началу | Установите курсор в конец слова и нажмите клавиши CTRL+SHIFT+СТРЕЛКА ВЛЕВО. |
Строка от начала к концу | Нажмите клавишу HOME, а затем нажмите клавиши SHIFT+END. |
Строка от конца к началу | Нажмите клавишу END, а затем нажмите клавиши SHIFT+HOME. |
Одна строка вниз | Нажмите клавишу END, а затем нажмите клавиши SHIFT+СТРЕЛКА ВНИЗ. |
Одна строка вверх | Нажмите клавишу HOME, а затем нажмите клавиши SHIFT+СТРЕЛКА ВВЕРХ. |
Абзац от начала к концу | Установите курсор в начало абзаца и нажмите клавиши CTRL+SHIFT+СТРЕЛКА ВНИЗ. |
Абзац от конца к началу | Установите курсор в конец абзаца и нажмите клавиши CTRL+SHIFT+СТРЕЛКА ВВЕРХ. |
Документ от конца к началу | Установите курсор в конец документа и нажмите клавиши CTRL+SHIFT+HOME. |
Документ от начала к концу | Установите курсор в начало документа и нажмите клавиши CTRL+SHIFT+END. |
От начала до конца окна | Установите курсор в начало окна и нажмите клавиши ALT+CTRL+SHIFT+PAGE DOWN. |
Весь документ | Нажмите клавиши CTRL+A. |
Вертикальный блок текста | Нажмите клавиши CTRL+SHIFT+F8, а затем используйте клавиши со стрелками. Для выхода из режима выделения нажмите клавишу ESC. |
Ближайший знак | Нажмите клавишу F8 для входа в режим выделения, а затем нажмите клавишу СТРЕЛКА ВЛЕВО или СТРЕЛКА ВПРАВО; для выхода из режима выделения нажмите клавишу ESC. |
Слово, предложение, абзац или документ | Нажмите клавишу F8 для входа в режим выделения, а затем нажмите клавишу F8 один раз, чтобы выделить слово, два раза, чтобы выделить предложение, три раза, чтобы выделить абзац или четыре раза, чтобы выделить документ. Для выхода из режима выделения нажмите клавишу ESC. |
Выделение элементов таблицы
Выделяемый элемент | Действие |
Содержимое следующей ячейки | Нажмите клавишу TAB. |
Содержимое предыдущей ячейки | Нажмите клавиши SHIFT+TAB. |
Содержимое нескольких смежных ячеек | При нажатой клавише SHIFT несколько раз нажмите соответствующую клавишу со стрелкой, пока не будет выделено содержимое всех нужных ячеек. |
Содержимое столбца | Выделите верхнюю или нижнюю ячейку столбца, нажмите клавишу SHIFT и, удерживая ее, несколько раз нажмите клавишу СТРЕЛКА ВВЕРХ или СТРЕЛКА ВНИЗ, пока не будет выделено содержимое столбца. |
Содержимое таблицы целиком | Щелкните в любом месте таблицы, а затем нажмите клавиши ALT+5 на цифровой клавиатуре (при выключенном индикаторе NUM LOCK). |
В следующих постах расскажу ещё о простых, но важных навыках работы с офисными приложениями.
Как автоматически убрать лишние пробелы в Word
Многие пользователи при редактировании текста используют множественные повторы пробелов или табуляции. Таким образом они выравнивают текст перед печатью и приводят форматирование к тому виду, который их устраивает. Такой подход приводит к тому, что при дальнейшей работе с текстовым документом эти лишние пробелы приходится удалять, так как они оказываются внутри текста.
К счастью, удалять подобные повторы вручную не обязательно. Вместо этого можно воспользоваться функцией поиска и замены по тексту. В этой инструкции мы расскажем о том, как убрать лишние пробелы или табуляции в текстовом документе Word. Инструкция будет полезной для всех версий Word, включая Word 2003, 2007, 2010, 2013, 2016 и 2019.
Простой вариант поиска и замены
Если вам нужно автоматически убрать лишние пробелы в тексте документа Word, то самым простым способом будет замена двух пробелов на один. Если выполнить эту процедуру некоторое количество раз, то все повторы будут удалены. Это не самый быстрый способ, но его легко запомнить и воспроизвести в следующий раз, когда такая необходимость снова возникнет.
Итак, для того чтобы воспользоваться функцией замены вам нужно нажать комбинацию клавиш Ctrl-H на клавиатуре либо нажать Ctrl-F и потом перейти к функции замены. На скриншоте внизу показано, как это выглядит в современных версиях Word, таких как Word 2007, 2010, 2013, 2016 и 2019.
Если вы пользуетесь Word 2003, то для запуска функции поиска и замены вы можете использовать комбинацию клавиш Ctrl-H либо открыть меню « Правка » и выбрать « Заменить ».
В результате перед вами должно появиться окно « Найти и заменить ». Здесь есть два поля для ввода текста.
- В поле « Найти » нужно ввести два пробела
- А в поле « Заменить на » – один пробел .
После этого нужно нажать на кнопку «Заменить все » для того, чтобы выполнить поиск и замену.
В результате Word выполнит поиск по тексту и замену. Теперь эту операцию нужно повторить несколько раз, для того чтобы удалить все лишние пробелы в тексте.
В каждым повторением количество замен будет уменьшаться. Повторяйте поиск и замену до тех пор, пока число выполненных замен не будет равно нулю.
Быстрый вариант поиска и замены
Указанную выше процедуру удаления лишних пробелов можно выполнить за один проход поиска и замены. Для этого в окне « Найти и заменить » нужно нажать на кнопку « Больше » для того, чтобы получить доступ к дополнительным настройкам поиск.
После этого нужно включить опцию « Подстановочные знаки ».
Дальше нужно правильно заполнить поля « Найти » и « Заменить на ».
- В поле « Найти » нужно ввести один пробел и вот такую конструкцию: <2;>
- А в поле « Заменить на » вводим просто один пробел, как и в предыдущем случае.
При такой конфигурации поиск и замена лишних пробелов будет выполнена за один проход. Все строки, состоящие из повторяющихся пробелов, будут заменены.
Поиск и замена повторяющихся табуляций
Нужно понимать, что большие отступы в тексте могут быть реализованы не только пробелами, но и другими специальными символами. Например, для этого не редко используют табуляции (клавиша Tab на клавиатуре). Чтобы узнать, что конкретно используется в вашем случае нужно включить отображение непечатаемых символов с помощью кнопки « Отобразить все знаки » на вкладке « Главная »
После этого в тексте будет видно, что конкретно используется для отступов: табуляции, пробелы или что-то другое.
Для замены повторяющихся табуляций на один пробел в поле « Найти » нужно ввести вот такую конструкцию: ^t
После замены в таком варианте все повторяющиеся табуляции должны быть заменены на один пробел.
- Как перевернуть страницу в Word
- Как построить график в Excel
- Как перевести PDF в Word
- Как сделать альбомную страницу в Word
- Как сделать вертикальный текст в Word
Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.
Задайте вопрос в комментариях под статьей или на странице «Задать вопрос» и вы обязательно получите ответ.