Данните са нещо, което има много голяма роля в нашия живот. Те са практически навсякъде в ежедневието ни и влиянието, което оказват върху нас, е огромно. Важно е обаче да знаем как можем да ги управляваме и да извличаме полза от тях.
В една организация данни постъпват както от вътрешни източници (оперативни системи, справки, доклади и др.), така и от външни (информация за конкуренти, тенденции, проучвания и др.). Обемът на обработваната информация е голям и затова фирми навсякъде по света търсят възможно най-ефективните начини за управление на данните си.
Използването на бази данни и складове за данни (data warehouse) дава възможност за по-лесно и ефективно обработване на информацията. В тази статия ние ще видим каква точно е разликата между тези два начина за съхранение и управление на данни.
Database vs Data Warehouse
Каква е същността им?
Базата данни представлява колекция от данни, които са логически свързани помежду си. Тя има много широко предназначение, оптимизирана е за ежедневните транзакции и е изкючително важна за организацията, която я използва.
За ефективно създаване и управление на базата данни се използва така наречената система за управление на бази данни (СУБД). Това са набор от програми, които позволяват контрол и манипулиране на данните.
На схемата по-долу може да видите типична архитектура на приложение и система за управление на бази данни, позволяващи достъп на потребителите до данните през модулите на приложението.
Източник: Database Systems: A Practical Approach to Design, Implementation, and Management by Thomas Connolly and Carolyn Begg
Данните се извличат от базата данни и се обработват чрез СУБД, след което всеки от служителите на съответния отдел има достъп до модули на приложението, създадени за позицията, на която работи.
Складът за данни е релационна или денормализирана структура от данни, които могат да са взети и от различни източници (Интернет и др.). В нея се организират и съхраняват историческите данни на организацията. Те след това се анализират и от тях се изготвят отчети, които са полезни при взимане на важни решения.
В склада влизат само определени данни, които са важни за анализаторите. Те са направени само за четене и достъпът до тях е гъвкав и безопасен.
Архитектурата на складовете за данни може да е различна. Тя зависи много от потребностите на съответната организация. Има три най-често срещани архитектури:
Основна – крайният потребител има директен достъп до данните, извлечени от няколко различни източника.
Източник: Oracle® Database Data Warehousing Guide 10g Release 2 (10.2)
С междинно хранилище (staging area) – при този тип архитектура има междинно хранилище, в което се обработват и обединяват данни от множество източници преди да бъдат достъпни в склада за данни за потребителите.
Източник: Oracle® Database Data Warehousing Guide 10g Release 2 (10.2)
С междинно хранилище и центрове за данни (data marts) – освен междинно хранилище, при тази архитектура, данните от склада се разпределят по центрове за данни за определени отдели на фирмата. Така те имат достъп само до информация, която е важна за тях.
Източник: Oracle® Database Data Warehousing Guide 10g Release 2 (10.2)
За какво се използват?
Базите данни и складовете за данни имат широко приложение. Използват се изключително много за събиране и обработка на данни. На база на това компаниите могат да се адаптират към промени, които настъпват в сектора, в който работят.
Едно от най-популярните приложения на базите данни в последните години е при онлайн търговията и електронните разплащания. Всички магазини, които продават стоки по интернет, използват база данни. Като пример можем да дадем Amazon или eBay, които съхраняват, актуализират и представят данни на своите клиенти за продуктите, които предлагат.
За разлика от базите данни, складовете за данни се използват например за прогнозиране, статистически анализи и изготвяне на отчети. Благодарение на това е възможно да се види много ясно състоянието, в което се намира съответната фирма, и на тази база да се поставят определени цели.
Складовете за данни се използват например в банковата индустрия при анализиране на данни за потребителите, пазарни тенденции, справяне с риск и други. Банките трябва да бъдат наясно с нуждите на своите клиенти и да им предлагат подходящи услуги. Например една банка може да обобщи данните за транзакциите на своите картодържатели и в зависимост от това да направи някакво специално промоционално предложение.
Предимства и недостатъци
База данни
Предимства:
- Нормализирани данни
- Бързо и лесно извършване на транзакции
- Висока сигурност на данните
Недостатъци:
Недостатъци:
- Забавяне на аналитичните заявки заради нормализирания характер на данните
- При проблем с базата данни са засегнати всички приложения, зависещи от нея
- Моделът на данните съдържа повече таблици от този на склада за данни в повечето случаи
Склад за данни
Предимства:
- Лесен достъп до голям обем данни, които може да са взети и от различни източници
- При проблем със склада не са засегнати основните приложения, с които работи компанията
- Денормализираните данни дават на аналитиците по-големи възможности за комбинирането им в нови измерения (дименсии)
Недостатъци:
- Има допълнителни разохди за ресурси при внедряване на склад за данни
- Използва се само от специализирани лица за анализи
- Изисква се постоянна актуализация на данните, което отнема време
Съпоставка
Складът от данни и базите данни имат приложение в еднакви сектори, но за различни неща, поради факта, че имат различно предназначение. Също така, до базата данни имат достъп широк брой от потребители, а до склада само хора на специализирани позиции.
В таблицата по-долу можете да видите съпоставката на базите данни и складовете за данни по определени критерии.
В таблицата по-долу можете да видите съпоставката на базите данни и складовете за данни по определени критерии.
Критерии | Database | Data Warehouse |
---|---|---|
Предназначение | моментни транзакции | анализ на данни |
Обработка на данните | онлайн обработка на транзакции (OLTP) | аналитична онлайн обработка (OLAP) |
Нормализация на данните | да | да или не |
Сигурност на данните | висока | висока |
Достъпност на данните | трудна | лесна |
Типични примери за приложение | CRM и ERP системи, облачни услуги, онлайн търговия и др. | анализ на конкретни дейности, продукти, услуги и др. на фирмата |
Потребители | всеки | предимно анализатори |
Като извод можем да кажем, че е необходимо фирмите да използват бази данни, особено сега, когато живеем във време, в което толкова бързо нараства количеството данни и обработката им с други средства става все по-трудна. От друга страна е важно да се внедри и склад за данни, за да се подобри и ускори процеса на изготване на анализи и отчети за дейността на фирмата.
Искате да научите повече за базите данни, SQL и възможностите за анализ с него?
Вижте повече за специализирания курс SQL | Анализ на данни и изготвяне на отчети
Автор: Десислава Христова