Старый 06.10.2011, 21:02   # 1

9 группа
 
Аватар для poolk
 
Регистрация: 18.08.2011
Адрес: Россия... пока...
Сообщений: 33
Сказал(а) спасибо: 5
Поблагодарили 21 раз(а) в 7 сообщениях
По умолчанию Контент с журналов

Не судите строго...
Расскажу, как получаю уникальный контент я.
Пункт 1. Качаем с рутрекера или еще откуда-нибудь FineReader 11
Пункт 2. Качаем оттуда же подборку каких нить журналов (обычно выкладывают сразу архивами за несколько лет). Следим, чтобы они были уникальны. Я брал за 7-9 года фотожурналы.
Пункт 3. Создаем в FineReader задачу(сценарий):
1. Создать новый документ
2. Открыть изображение \ PDF
3. Анализ
4. Распознование
5. Сохданить документ(я сохраняю сразу в 3 формата: doc, html, txt. Из html потом просто копировать удобнее, а в ворде смотреть)
Пункт 4. Кидаем в указанную папку штук 5 pdf-журналов (почему 5? не знаю)) я больше не пробовал, думал комп зависнет...) и запускаем задачу.
Пункт 5. Ждем. Я обычно на ночь оставляю, к утру все готово.
Пункт 6. Осталось разбить распознанный текст на статьи, можно отдать на выполнение какому нить школьнику за 50р...

Вроде все)
poolk вне форума   Ответить с цитированием
Сказали спасибо:

beroslav (12.10.2011), Brucey (06.10.2011), cherryto (07.10.2011), Gamilton (07.10.2011), krylyshkin (07.10.2011), not (17.10.2011), promoter (07.10.2011), Self (25.11.2011), tokado (06.10.2011), Ландыш (07.10.2011), Олег (12.10.2011)

Старый 06.10.2011, 21:30   # 2

Волшебный пинок
 
Аватар для daymos
 
Регистрация: 29.09.2011
Сообщений: 29
Сказал(а) спасибо: 3
Поблагодарили 22 раз(а) в 2 сообщениях
По умолчанию

а гугл пдф разве не читает?
daymos вне форума   Ответить с цитированием
Старый 06.10.2011, 21:41   # 3

9 группа
 
Аватар для poolk
 
Регистрация: 18.08.2011
Адрес: Россия... пока...
Сообщений: 33
Сказал(а) спасибо: 5
Поблагодарили 21 раз(а) в 7 сообщениях
По умолчанию

читает. и яндекс читает. вопрос в том, что пдф тоже может быть разным.
Пример:
напечатай в ворде текст, гугл и яндекс его распознают. напечатай текст, сделай скриншот и вставь в ворд - совершенно другое дело будет. и никто не распознает... так же и с пдфами, текст может быть в них текстом, а может быть картинкой...
poolk вне форума   Ответить с цитированием
Старый 06.10.2011, 21:51   # 4

5 группа
 
Аватар для Brucey
 
Регистрация: 03.01.2011
Адрес: зачем интересуетесь, товарищ майор?
Сообщений: 2,285
Сказал(а) спасибо: 1,867
Поблагодарили 931 раз(а) в 462 сообщениях
По умолчанию

daymos, а как он с торрентов-то прочитает?
Brucey вне форума   Ответить с цитированием
Старый 07.10.2011, 04:01   # 5

Волшебный пинок
 
Аватар для daymos
 
Регистрация: 29.09.2011
Сообщений: 29
Сказал(а) спасибо: 3
Поблагодарили 22 раз(а) в 2 сообщениях
По умолчанию

Цитата:
Сообщение от Brucey Посмотреть сообщение
daymos, а как он с торрентов-то прочитает?
сегодня на торенте - завтра в общем доступе
daymos вне форума   Ответить с цитированием
Старый 07.10.2011, 13:19   # 0

6 группа
 
Аватар для krylyshkin
 
Регистрация: 21.03.2011
Сообщений: 410
Сказал(а) спасибо: 544
Поблагодарили 231 раз(а) в 94 сообщениях
По умолчанию

Лучше со старых журналов брать, 80-х годов.
Берешь отдельную рубрику, типа "Дети говорят" и делаешь на её основе сайт.
krylyshkin вне форума   Ответить с цитированием
Пользователь сказал cпасибо:

Self (25.11.2011)

Старый 07.10.2011, 22:51   # 7

Волшебный пинок
 
Регистрация: 26.09.2011
Сообщений: 18
Сказал(а) спасибо: 135
Поблагодарили 14 раз(а) в 3 сообщениях
По умолчанию

У кого есть опыт с контентом из закрытых сайтов , библиотек(инглищ)
При наличие большого количества уникального англииского контента что выгоднее создать 10 больших тематических саитов или кучу мелких блогов?

Каковы шансы получить абузы за чужой контент? Хоть и уникален но авторство чужое и легко доказуемо.

Каковы самые выгодные методы монетизации с учетом что текст не оптимизирован под ключевики? Текст с большого количества книг. Естественно полезен читателю в оригинальном виде.

Если кто может проконсультировать по данному вопросы буду премного благодарен.
Iulius вне форума   Ответить с цитированием
Старый 12.10.2011, 12:48   # 8

3 группа
 
Аватар для BlackAlex
 
Регистрация: 21.07.2010
Адрес: Украина
Сообщений: 637
Сказал(а) спасибо: 233
Поблагодарили 311 раз(а) в 119 сообщениях
По умолчанию

я думал, что весь рутракер уже давно распознали файнридером))
BlackAlex вне форума   Ответить с цитированием
Старый 12.10.2011, 18:07   # 9

:)
 
Аватар для sydoow
 
Регистрация: 18.07.2011
Сообщений: 1,006
Сказал(а) спасибо: 803
Поблагодарили 484 раз(а) в 273 сообщениях
По умолчанию

Значит нужно искать закрытые торренты (возможно даже спец литературные) и там сканить
Рутрекер не такой уж и большой)
__________________

Каждый ден в дорген

sydoow вне форума   Ответить с цитированием
Ответ

Метки
finereader, html


Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 
Опции темы



Текущее время: 16:44. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
www.megastock.ru
spacer