Истинският ми проблем е свързан със записването кой от много голям брой антивирусни продукти е съгласен, че дадена извадка е член на дадено антивирусно семейство. Базата данни съдържа милиони проби, като десетки антивирусни продукти гласуват за всяка извадка. Искам да задам запитване като "За зловреден софтуер, съдържащ името "XYZ", коя проба имаше най-много гласове и кои доставчици гласуваха за него?" и получете резултати като:
"BadBadVirus"
V1 V2 V3 V4 V5 V6 V7
Sample 1 - 4 votes 1 0 1 0 0 1 1
Sample 2 - 5 votes 1 0 1 0 1 1 1
Sample 3 - 5 votes 1 0 1 0 1 1 1
total 14 3 3 2 3 3
Което може да се използва, за да ми каже, че Доставчик 2 и Доставчик 4 или не знаят как да открият този зловреден софтуер, или че го наричат по различен начин.
Ще се опитам леко да обобщя въпроса си, като се надявам, че няма да наруша способността ви да ми помагате. Да приемем, че имам пет гласуващи (Алекс, Боб, Карол, Дейв, Ед), които са били помолени да разгледат пет снимки (P1, P2, P3, P4, P5) и да решат кой е „основният обект“ на снимката. За нашия пример просто ще приемем, че са били ограничени до „Котка“, „Куче“ или „Кон“. Не всеки избирател гласува за всичко.
Данните са в базата данни в следния вид:
Photo, Voter, Decision
(1, 'Alex', 'Cat')
(1, 'Bob', 'Dog')
(1, 'Carol', 'Cat')
(1, 'Dave', 'Cat')
(1, 'Ed', 'Cat')
(2, 'Alex', 'Cat')
(2, 'Bob', 'Dog')
(2, 'Carol', 'Cat')
(2, 'Dave', 'Cat')
(2, 'Ed', 'Dog')
(3, 'Alex', 'Horse')
(3, 'Bob', 'Horse')
(3, 'Carol', 'Dog')
(3, 'Dave', 'Horse')
(3, 'Ed', 'Horse')
(4, 'Alex', 'Horse')
(4, 'Bob', 'Horse')
(4, 'Carol', 'Cat')
(4, 'Dave', 'Horse')
(4, 'Ed', 'Horse')
(5, 'Alex', 'Dog')
(5, 'Bob', 'Cat')
(5, 'Carol', 'Cat')
(5, 'Dave', 'Cat')
(5, 'Ed', 'Cat')
Целта е при дадена тема за снимка, която търсим, да знаем колко гласоподаватели смятат, че това Е основното в тази снимка, но също така да изброим КОИ ГЛАСОПОДАВАТЕЛИ смятат това.
Query for: "Cat"
Total Alex Bob Carol Dave Ed
1 - 4 1 0 1 1 1
2 - 3 1 0 1 1 0
3 - 0 0 0 0 0 0
4 - 1 0 0 1 0 0
5 - 4 0 1 1 1 1
------------------------------------
total 12 2 1 4 3 2
Query for: "Dog"
Total Alex Bob Carol Dave Ed
1 - 1 0 1 0 0 0
2 - 2 0 1 0 0 1
3 - 1 0 0 1 0 0
4 - 0 0 0 0 0 0
5 - 1 1 0 0 0 0
------------------------------------
total 5 1 2 1 0 1
Това ли е нещо, което мога да направя с данните във формата, в който ги съхранявам?
Имам затруднения с получаването на заявка, която прави това - въпреки че е достатъчно просто да изхвърлите данните и след това да напишете програма, която да направи това, наистина бих искал да мога да го направя В БАЗАТА ДАННИ, ако мога.
Благодаря за всякакви предложения.