Допустим, у меня есть RDD вроде
[(u'Some1', (u'ABC', 9989)),
(u'Some2', (u'XYZ', 235)),
(u'Some3', (u'BBB', 5379)),
(u'Some4', (u'ABC', 5379))]
Я использую map
для получения одного кортежа за раз, но как я могу получить доступ к отдельному элементу кортежа, например, чтобы увидеть, содержит ли кортеж какой-либо символ. На самом деле я хочу отфильтровать те, которые содержат какой-то символ. Здесь кортежи, содержащие ABC
Я пытался сделать что-то подобное, но это не помогает
def foo(line):
if(line[1]=="ABC"):
return (line)
new_data = data.map(foo)
Я новичок в искре и питоне, пожалуйста, помогите!