Извличане на подмножество от двойки ключ-стойност от обекта на речника на Python?

Имам голям речников обект, който има няколко двойки ключови стойности (около 16), но се интересувам само от 3 от тях. Кой е най-добрият начин (най-кратък/ефикасен/най-елегантен) за постигане на това?

Най-доброто, което знам е:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

Сигурен съм, че има по-елегантен начин от този. Идеи?


person Jayesh    schedule 18.03.2011    source източник


Отговори (11)


Можете да опитате:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

... или в Python 3 Python версии 2.7 или по-нова (благодарение на Fábio Diniz за отбелязването, че работи и в 2.7):

{k: bigdict[k] for k in ('l', 'm', 'n')}

Актуализация: Както отбелязва Håvard S, предполагам, че знаете, че ключовете ще бъдат в речника - вижте отговорът му, ако не можете да направите това предположение. Като алтернатива, както timbo посочва в коментарите, ако искате ключ, който липсва в bigdict, да се преобразува в None, можете направи:

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

Ако използвате Python 3 и само искате ключове в новия dict, които действително съществуват в оригиналния, можете да използвате факта, за да видите обекти, които изпълняват някои набор операции:

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}
person Mark Longair    schedule 18.03.2011
comment
Ще се провали, ако bigdict не съдържа k - person Håvard S; 18.03.2011
comment
@Håvard S: Мисля, че от публикацията на OPs можем да предположим, че всички дадени дадени елементи са в bigdict. - person phimuemue; 18.03.2011
comment
или в Python 3 или или в Python ›= 2.7? - person Fábio Diniz; 18.03.2011
comment
{k: bigdict.get(k,None) for k in ('l', 'm', 'n')} ще се справи със ситуацията, при която определен ключ липсва в изходния речник, като зададе ключ в новия dict на None - person timbo; 22.12.2013
comment
Благодаря, @timbo - добавих и това към отговора, надявам се, че е ОК - person Mark Longair; 22.12.2013
comment
@MarkLongair В зависимост от случая на използване {k: bigdict[k] for k in ('l','m','n') if k in bigdict} може да е по-добре, тъй като съхранява само ключовете, които действително имат стойности. - person Briford Wylie; 08.03.2014
comment
Гласуване за това и свързания отговор от @HåvardS, което е точно това, което търсех. Обичам, когато разработчиците цитират правилно кода. - person Michael Scheper; 22.03.2016
comment
Надявам се редакцията ми да не е твърде самонадеяна. Версията на @BrifordWylie може да е по-добра, ако искате да избегнете по същество недокументирана функция. - person ; 02.04.2016
comment
@hop Благодаря за допълнението - направих малка промяна, само за да стане ясно, че работи само на Python 3. - person Mark Longair; 03.04.2016
comment
Как мога да проверя дали ['l','m','n'] е подниз на k? - person Arjun; 30.06.2016
comment
bigdict.keys() & {'l', 'm', 'n'} ==› bigdict.viewkeys() & {'l', 'm', 'n'} за Python2.7 - person kxr; 25.08.2016
comment
{ x : bigdict[x] for x in (1, 2, 3) if x in bigdict.keys() }, за да избегнете KeyError и None стойностите. - person varun; 29.03.2018
comment
Последното решение е хубаво, защото можете просто да замените „&“ с -, за да получите всички клавиши с изключение на операцията. За съжаление това води до речник с различно подредени ключове (дори в python 3.7 и 3.8) - person naught101; 19.06.2020
comment
Ами ако моят dict е твърде голям? - person Adamantish; 18.03.2021
comment
dict.get(k), ще върне None по подразбиране, ако k не бъде намерено, няма нужда изрично да задавате това по подразбиране като параметър - person Clint Eastwood; 14.05.2021

Поне малко по-кратко:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)
person Håvard S    schedule 18.03.2011
comment
+1 за алтернативно поведение на изключване на ключ, ако не е в bigdict, за разлика от настройката му на None. - person dhj; 12.06.2014
comment
Като алтернатива: dict((k,bigdict.get(k,defaultVal) for k in wanted_keys) ако трябва да имате всички ключове. - person Thomas Andrews; 01.05.2018
comment
Този отговор е запазен от t. - person sakurashinken; 29.05.2019

Малко сравнение на скоростта за всички споменати методи:

АКТУАЛИЗИРАНО на 13.07.2020 (thx на @user3780389): САМО за ключове от bigdict.

 IPython 5.5.0 -- An enhanced Interactive Python.
Python 2.7.18 (default, Aug  8 2019, 00:00:00) 
[GCC 7.3.1 20180303 (Red Hat 7.3.1-5)] on linux2
import numpy.random as nprnd
  ...: keys = nprnd.randint(100000, size=10000)
  ...: bigdict = dict([(_, nprnd.rand()) for _ in range(100000)])
  ...: 
  ...: %timeit {key:bigdict[key] for key in keys}
  ...: %timeit dict((key, bigdict[key]) for key in keys)
  ...: %timeit dict(map(lambda k: (k, bigdict[k]), keys))
  ...: %timeit {key:bigdict[key] for key in set(keys) & set(bigdict.keys())}
  ...: %timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
  ...: %timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 2.36 ms per loop
100 loops, best of 3: 2.87 ms per loop
100 loops, best of 3: 3.65 ms per loop
100 loops, best of 3: 7.14 ms per loop
1 loop, best of 3: 577 ms per loop
1 loop, best of 3: 563 ms per loop

Както се очакваше: речниковите разбирания са най-добрият вариант.

person Sklavit    schedule 29.03.2016
comment
Първите 3 операции правят нещо различно от последните две и ще доведат до грешка, ако key не съществува в bigdict. - person naught101; 19.06.2020
comment
хубаво. може би си струва да добавите {key:bigdict[key] for key in bigdict.keys() & keys} от приетото решение, което изпълнява филтъра, като същевременно е по-бързо (на моята машина) от първия метод, който списък, който не филтрира. Всъщност {key:bigdict[key] for key in set(keys) & set(bigdict.keys())} изглежда дори по-бърз за тези много големи набори ключове ... - person teichert; 08.07.2020

Този отговор използва речниково разбиране, подобно на избрания отговор, но няма да се изключи липсващ елемент.

версия на python 2:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

версия на python 3:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}
person Meow    schedule 12.07.2015
comment
... но ако големият dict е ОГРОМЕН, той пак ще бъде повторен напълно (това е O(n) операция), докато обратното просто ще вземе 3 елемента (всеки O(1) операция). - person wouter bolsterlee; 05.10.2015
comment
Въпросът е за речник от само 16 ключа - person Meow; 06.10.2015

Може би:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

Python 3 дори поддържа следното:

subdict={a:bigdict[a] for a in ['l','m','n']}

Имайте предвид, че можете да проверите за съществуване в речника, както следва:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

респ. за python 3

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}
person phimuemue    schedule 18.03.2011
comment

От официалния уебсайт за обмен на валута в Мексико, http://dof.gob.mx/index.php, Трябва да изтегля курса на USD в най-дясната част на страницата в просто математическо уравнение в заявка на SQL Server 2005, за да изчисля USD към мексикански песо за фактури. Възможно ли е това и ако да как?

- person Håvard S; 18.03.2011
comment
нещата, за които се твърди, че работят само в python 3, работят и в 2.7 - person Clint Eastwood; 14.05.2021

Можете също да използвате map (което е много полезна функция, за да се запознаете така или иначе):

sd = dict(map(lambda k: (k, l.get(k, None)), l))

Пример:

large_dictionary = {'a1':123, 'a2':45, 'a3':344}
list_of_keys = ['a1', 'a3']
small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))

PS: Взех .get(key, None) от предишен отговор :)

person halfdanrump    schedule 23.02.2014

Добре, това е нещо, което ме безпокои няколко пъти, така че благодаря ти, Джайеш, че го попита.

Отговорите по-горе изглеждат толкова добро решение, колкото и всяко друго, но ако използвате това в целия си код, има смисъл да обгърнете функционалността IMHO. Освен това тук има два възможни случая на използване: единият, при който ви интересува дали всички ключови думи са в оригиналния речник. и такъв, където не го правиш. Би било хубаво и двете да се третират еднакво.

И така, за моите две стотинки предлагам да напиша подклас речник, напр.

class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

Сега можете да извадите подречник с

orig_dict.subdict(keywords)

Примери за употреба:

#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:\n%r\n\n' % (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys\n\n")
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,))
except KeyError:
    print("We shouldn't see this message")

Ако изпълните целия горен код, трябва да видите (нещо като) следния изход (съжалявам за форматирането):

Оригинален речник:
{'a': 0, 'c': 2, 'b': 1, 'e': 4, 'd': 3, 'g': 6, 'f': 5, ' i': 8, 'h': 7, 'k': 10, 'j': 9, 'm': 12, 'l': 11, 'o': 14, 'n': 13, 'q' : 16, "p": 15, "s": 18, "r": 17, "u": 20, "t": 19, "w": 22, "v": 21, "y": 24 , 'x': 23, 'z': 25}

Речник от клавиши с нечетни номера:
{'a': 0, 'c': 2, 'e': 4, 'g': 6, 'i': 8, 'k': 10, 'm': 12, "o": 14, "q": 16, "s": 18, "u": 20, "w": 22, "y": 24}

конструкцията на subd2 е неуспешна:
оригиналният речник не съдържа някои ключове

Речник, създаден с помощта на някои лоши ключове:
{'b': 1, 'd': 3, 'f': 5, 'h': 7, 'j': 9, 'l': 11, 'n' : 13, 'p': 15, 'r': 17, 't': 19, 'v': 21, 'x': 23, 'z': 25}

person pandamonium    schedule 11.03.2015
comment
Подкласирането изисква съществуващ dict обект да бъде преобразуван в типа подклас, което може да бъде скъпо. Защо просто не напишете проста функция subdict(orig_dict, keys, …)? - person musiphil; 17.07.2015

Още един (предпочитам отговора на Марк Лонгеър)

di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])
person georg    schedule 05.04.2013
comment
бавно е за големидикт - person kxr; 28.01.2016

решение

from operator import itemgetter
from typing import List, Dict, Union


def subdict(d: Union[Dict, List], columns: List[str]) -> Union[Dict, List[Dict]]:
    """Return a dict or list of dicts with subset of 
    columns from the d argument.
    """
    getter = itemgetter(*columns)

    if isinstance(d, list):
        result = []
        for subset in map(getter, d):
            record = dict(zip(columns, subset))
            result.append(record)
        return result
    elif isinstance(d, dict):
        return dict(zip(columns, getter(d)))

    raise ValueError('Unsupported type for `d`')

примери за употреба

# pure dict

d = dict(a=1, b=2, c=3)
print(subdict(d, ['a', 'c']))

>>> In [5]: {'a': 1, 'c': 3}
# list of dicts

d = [
    dict(a=1, b=2, c=3),
    dict(a=2, b=4, c=6),
    dict(a=4, b=8, c=12),
]

print(subdict(d, ['a', 'c']))

>>> In [5]: [{'a': 1, 'c': 3}, {'a': 2, 'c': 6}, {'a': 4, 'c': 12}]
person DmitrySemenov    schedule 24.05.2020

Използването на map (отговорът на halfdanrump) е най-доброто за мен, въпреки че не съм го замерил...

Но ако изберете речник и ако имате big_dict:

  1. Уверете се, че преминавате през req. Това е от решаващо значение и влияе върху времето за изпълнение на алгоритъма (голямо O, тита, каквото и да е)
  2. Напишете го достатъчно общо, за да избегнете грешки, ако ключовете не са там.

so e.g.:

big_dict = {'a':1,'b':2,'c':3,................................................}
req = ['a','c','w']

{k:big_dict.get(k,None) for k in req )
# or 
{k:big_dict[k] for k in req if k in big_dict)

Обърнете внимание, че в обратния случай, когато req е голям, но my_dict е малък, вместо това трябва да преминете през my_dict.

Като цяло, ние правим пресичане и сложността на проблема е O(min(len(dict)),min (len(req))). собствена реализация на пресичане на Python отчита размера на двата набора , така че изглежда оптимално. Освен това, като е в c и е част от основната библиотека, вероятно е по-бързо от повечето неоптимизирани изрази на python. Следователно решение, което бих обмислил, е:

dict = {'a':1,'b':2,'c':3,................................................}
req = ['a','c','w',...................]

{k:dic[k] for k in set(req).intersection(dict.keys())}

Той премества критичната операция вътре в c кода на python и ще работи за всички случаи.

person ntg    schedule 11.11.2020

person    schedule
comment
@loutre как иначе предлагате да гарантирате, че извличате всички данни за дадените ключове? - person theheadofabroom; 10.08.2020
comment
съжалявам, направих грешка. Мислех си, че повтаряш bigdict. Моя грешка. Изтривам коментара си - person loutre; 12.08.2020