Не будем теряться в догадках, а отметим, что теоретически можно узнать с помощью элементарных (и не только) технических средств про каждого пользователя ЖЖ и про всех оных в их совокупности:
- частота записей в журнале пользователя
- частота его комментариев
- частота просмотров записей других пользователей (вместе с комментариями к ним)
- частота просмотра/обновления френд-ленты
(пп.1-4 характеризуют активность пользователя) - семантическое ядро *) (СЯ) записей пользователя у себя в журнале
- СЯ комментариев пользователя в других журналах
- СЯ просматриваемых записей других пользователей (вместе с комментариями к ним)
- число и СЯ записей в "избранном" (memories)
- СЯ френд-ленты (пп. 5-9 характеризуют интересы пользователя )
- число френдов пользователя
- число комментов других пользователей в журнале у пользователя
- число комментов данному пользователю от других пользователей в журналах у др. пользователей
- число зафрендивших данного пользователя, число попаданий записей пользователя в "избранное" других пользователей (этот пункт характеризует вес пользователя)
- частота использования данным пользователем речевых штампов ("кг/ам", "ниасилил", "аффтар жжот", в т.ч. ненормативная и падонковская лексика, прочие распространённые речевые обороты) - относительно общего количества текста пользователя
- % пользователей с заданным "усреднённым" СЯ журналов ("усреднённым" - по наибольшему числу совпадений, можно провести классификацию, каталогизацию и типизацию СЯ)
- % пользователей с заданным "усреднённым" СЯ комментариев
- % пользователей с заданным "усреднённым" СЯ интересов
- % пользователей, использующих речевые штампы (с распределением по частоте их использования, по активности пользователей и т.п.)
- % пользователей с заданным числом попаданий в избранное у др. пользователей
- % пользователей с заданным числом френдов
- место данного пользователя в данном распределении (по активности, интересам, весу, числу френдов, типам СЯ, по использованию той или иной лексики и речевых обротов и т.п.)
*) набор слов (порядка 10 для текста порядка 10Кб), наиболее точно отражающих тематику данного (фрагмента) текста. Пример: ключевые слова, tags в ЖЖ.