17 Июн

1.2 — Строение сайта или его скелет.

Содержание

1 Безопасность сайта

1.1 — Из чего состоит сайт

1.2 — Строение сайта

1.3 — Что такое доменное имя

1.4 — Что такое хостинг

1.5 — Как восстанавливать и переносить сайт

Строение сайта, важная часть, она может восстанавливаться как обратная разработка с целью автоматического, обнаружения  шаблонов и URL образцов сайта, и в предположениях, как эти шаблоны и образцы интегрировать, чтобы организовать ресурс.

Изучение этой проблемы имеет весомое отношение ко многим приложениям, которые могут усилить и расширить горизонтальные знание для сайта , чтобы помочь сетевому поиску и базе данных.

Почти у каждого веб-сайта в Интернете есть отличный дизайн и организационная структура. Мы обычно создаем различимые шаблоны  для расположения страниц и различных функций. Тогда они организуют веб-сайт, связывая различные страницы с гиперссылками, каждая из которых представлена последовательностью URL после некоторых предопределенных синтаксических образцов.

Для этого у нужно — обратное проектирование, чтобы автоматически обнаружить расположения шаблонов  и образцов (URL) веб-сайта, и понять, как эти шаблоны и образцы объединены, чтобы организовать веб-сайт. Чтобы продемонстрировать силу и власть в понимание структуры веб-сайта, этот проект предлагает некоторые правила, которые усиливают уровень знания места и точек, которые могут  помочь поиску в сети и сбору данных.

Правильное строение сайта

 

Шаблон расположения

Большинство веб-страниц состоит из элементов HTML таких как таблица, меню, кнопка, изображение и окно ввода. Расположение веб-страницы описывает, какие элементы HTML включены в страницу, а также как эти элементы визуально распределены в предоставлении страницы.

По существу расположение страницы представлено так называемым DOM (Модель Объекта Документа) информационное дерево. В проектах шаблон расположения рассматривают как группу страниц, у которых есть очень подобные расположения (деревья DOM).

DOM (информационное дерево)

В веб-сайте страницы произведены и основанные на различимых шаблонах согласно их функциям. То есть визуально у похожих страниц обычно есть та же самая функция. Таким образом пользователь может сразу легко идентифицировать функцию страницы .

Образец URL

Образец URL — обобщение группы URL, разделяющих подобный синтаксический формат. В целом образец URL может быть представлен с регулярным выражением.

Образец URL

Замечено, что у шаблонов расположения может быть больше чем один связанный образец URL. Например, веб-сайт продавца аквариумов обычно проектирует один шаблон, чтобы показать список аквариумов и обеспечивает различные параметры поиска, чтобы произвести такой список. Различные параметры поиска в этом сценарии приведут к различным образцам URL, но результаты поиска показывают с тем же самым шаблоном. Другой общий падеж — двойные страницы, т.е., страницы с тем же самым содержанием (и очень вероятно тем же самым расположением) , но различные URL.

Поймите строение веб-сайта

Чтобы автоматически обнаружить организацию структуры данного веб-сайта,  был предложен безнадзорный метод  в этом проекте. Главная идея состоит в том, чтобы сначала пробовать несколько страниц беспорядочно от целевого сайта, а затем обнаружить шаблон расположения и образцы URL, группируя эти выбранные страницы, и наконец то восстановить граф связи.

Возьмите во внимание.

Строение сайта состоит из четырех компонентов: случайная выборкагруппировка расположения страницыоткрытие образца URL и реконструкция структуры связи.

 

Перейти Перейти

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

5 + 2 =